返回顶部
首页 > 资讯 > 数据库 >01 | 数据中台笔记-中台的来源
  • 686
分享到

01 | 数据中台笔记-中台的来源

01|数据中台笔记-中台的来源 2019-04-16 17:04:16 686人浏览 猪猪侠
摘要

一、数仓的前世今生 起源 ​ 商业智能(Business Intelligence)诞生在上个世纪 90 年代,它是将企业已有的数据转化为知识,帮助企业做出经营分析决策。这些都离不开大量的数据分析。而数据分析需要聚合多个业务系统的数

01 | 数据中台笔记-中台的来源

一、数仓的前世今生

  1. 起源

​ 商业智能(Business Intelligence)诞生在上个世纪 90 年代,它是将企业已有的数据转化为知识,帮助企业做出经营分析决策。这些都离不开大量的数据分析。而数据分析需要聚合多个业务系统的数据,比如需要集成交易系统的数据,需要集成仓储系统的数据等等,同时需要保存历史数据,进行大数据量的范围查询。传统数据库面向单一业务系统,主要实现的是面向事务的增删改查,已经不能满足数据分析的场景,这促使数据仓库概念的出现。

建模方法

​ 比尔·恩门 和金博尔(Kimball) 共同开创的数仓建模的设计方法,这个方法对于后来基于数据湖的现代数据仓库的设计有重要的意义,所以你有必要了解。

  • 恩门提出的建模方法自顶向下(这里的顶是指数据的来源,在传统数据仓库中,就是各个业务数据库),基于业务中各个实体以及实体之间的关系,构建数据仓库。

  • 金博尔建模与恩门正好相反,是一种自底向上的模型设计方法,从数据分析的需求出发,拆分维度和事实。(工作开发普遍在用,推荐!!!)

二、hadoop到数据湖

  1. Hadoop出现

    2003 年开始,互联网巨头谷歌先后发表了 3 篇论文:《The Google File System》《mapReduce:Simplified Data Processing on Large Clusters》《Bigtable:A Distributed Storage System for Structed Data》,这三篇论文奠定了现代大数据的技术基础。

    ​ 但 2005 年 Hadoop 出现的时候,大数据技术才开始普及。你可以把 Hadoop 认为是前面三篇论文的一个开源实现,我认为 Hadoop 相比传统数据仓库主要有两个优势:

    • 完全分布式,易于扩展,可以使用价格低廉的机器堆出一个计算、存储能力很强的集群,满足海量数据的处理要求;

    • 弱化数据格式,数据被集成到 Hadoop 之后,可以不保留任何数据格式,数据模型与数据存储分离,数据在被使用的时候,可以按照不同的模型读取,满足异构数据灵活分析的需求。

  2. 数据湖提出

    数据湖概念的提出,我认为是 Hadoop 从开源技术走向商业化成熟的标志。企业可以基于 Hadoop 构建数据湖,将数据作为一种企业核心资产。

    数据湖拉开了 Hadoop 商用化的大幕,但是一个商用的 Hadoop 包含 20 多种计算引擎, 数据研发涉及流程非常多,技术门槛限制了 Hadoop 的商用化进程。那么如何让数据的加工像工厂一样,直接在设备流水线上完成呢?数据工厂时代:大数据平台兴起

三、数据工厂时代:大数据平台兴起

​ 对于一个数据开发,在完成一项需求时,常见的一个流程是首先要把数据导入到大数据平台中,然后按照需求进行数据开发。开发完成以后要进行数据验证比对,确认是否符合预期。接下来是把数据发布上线,提交调度。最后是日常的任务运维,确保任务每日能够正常产出数据。

​ 提出大数据平台的概念,就是为了提高数据研发的效率,降低数据研发的门槛,让数据能够在一个设备流水线上快速地完成加工。

大数据平台是面向数据研发场景的,覆盖数据研发的完整链路的数据工作台

Hivesparkflink、Impala 提供了大数据计算引擎:

  • Hive、Spark 主要解决离线数据清洗、加工的场景,目前,Spark 用得越来越多,性能要比 Hive 高不少;
  • Flink 主要是解决实时计算的场景;
  • Impala 主要是解决交互式查询的场景。

四、数据中台崛起

​ 时间到了 2016 年前后,互联网高速发展,背后对数据的需求越来越多,数据的应用场景也越来越多,有大量的数据产品进入到了我们运营的日常工作,成为运营工作中不可或缺的一部分。在电商业务中,有供应链系统,供应链系统会根据各个商品的毛利、库存、销售数据以及商品的舆情,产生商品的补货决策,然后推送给采购系统。

大规模数据的应用,也逐渐暴露出现一些问题。

业务发展前期,为了快速实现业务的需求,烟囱式的开发导致企业不同业务线,甚至相同业务线的不同应用之间,数据都是割裂的。两个数据应用的相同指标,展示的结果不一致,导致运营对数据的信任度下降。如果你是运营,当你想看一下商品的销售额,发现两个报表上,都叫销售额的指标出现了两个值,你的感受如何? 你第一反应肯定是数据算错了,你不敢继续使用这个数据了。

  • 如果你是运营,当你想要一个数据的时候,开发告诉你至少需要一周,你肯定想是不是太慢了,能不能再快一点儿?

  • 如果你是数据开发,当面对大量的需求的时候,你肯定是在抱怨,需求太多,人太少,活干不完。

  • 如果你是一个企业的老板,当你看到每个月的账单成指数级增长的时候,你肯定觉得这也太贵了,能不能再省一点,要不吃不消了。

    这些问题的根源在于,数据无法共享。2016 年,阿里巴巴率先提出了“数据中台”的口号。数据中台的核心,是避免数据的重复计算,通过数据服务化,提高数据的共享能力,赋能数据应用

您可能感兴趣的文档:

--结束END--

本文标题: 01 | 数据中台笔记-中台的来源

本文链接: https://lsjlt.com/news/8698.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 01 | 数据中台笔记-中台的来源
    一、数仓的前世今生 起源 ​ 商业智能(Business Intelligence)诞生在上个世纪 90 年代,它是将企业已有的数据转化为知识,帮助企业做出经营分析决策。这些都离不开大量的数据分析。而数据分析需要聚合多个业务系统的数...
    99+
    2019-04-16
    01 | 数据中台笔记-中台的来源
  • 数据中台的存储系统和计算平台枚举
    作者:向师富 转自:阿里巴巴数据中台官网 https://dp.alibaba.com 采集&传输层...
    99+
    2024-04-02
  • 宜信卢山巍:数据中台的“自动化数据治理”时代已来
    中台,我理解是能力的下沉,数据处理能力下沉为加工平台,数据处理结果下沉为数据资产。那么数据治理能否下沉?可以下沉出什么东西?——宜信数据中台负责人 卢山巍本文来源:宜信数据中台负责人卢山巍在亿欧产业互联网频道“数字中台创新”沙龙的分享实录原...
    99+
    2023-06-02
  • 数据迁移的高招!两台笔记本电脑怎么互传文件
    相信小伙伴都遇到过这样一个尴尬的局面:想用自己的笔记本电脑,给同事的笔记本传文件,却发现自己和同事都没有带U盘,怎么办?两台笔记本电脑怎么互传文件?接下来的方法你可能用的到。  适用于 Windows 10/8/7/Vista/XP...
    99+
    2023-09-21
    windows 服务器 网络
  • springboot添加多数据源的方法(笔记)
    Spring Boot可以通过配置多个数据源来支持多数据源访问,以下是一个基本的多数据源配置实例: 添加多数据源的配置类 创建一个配置类来配置多个数据源,可以使用@Configuration和@Pri...
    99+
    2023-09-05
    spring boot java spring
  • 友盟+数据技术专家4000字数据智能平台搭建实战笔记
    作者:友盟+数据技术专家 谭纯   简介: 2020年注定是不同寻常的,突如其来的疫情按下了人们生活的暂停键。对于用户激增的App而言有喜有忧,如何快速沉淀数据资产,因为疫情是脉冲式的需求,等疫情结束之后,如何把这些激增的用户转...
    99+
    2017-03-12
    友盟+数据技术专家4000字数据智能平台搭建实战笔记
  • 清理 Darwin/Mac 中的控制台数据
    学习Golang要努力,但是不要急!今天的这篇文章《清理 Darwin/Mac 中的控制台数据》将会介绍到等等知识点,如果你想深入学习Golang,可以关注我!我会持续更新相关文章的,希望对大家都能...
    99+
    2024-04-04
  • SAP云平台上的Fiori Launchpad tile数据是怎么从后台取出来的
    这篇文章将为大家详细讲解有关SAP云平台上的Fiori Launchpad tile数据是怎么从后台取出来的,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。通过我自己的用户登录HCP后,我可以...
    99+
    2023-06-04
  • 数据中台架构体系浅析
    中台出现的背景 从技术上来看,随着业务的发展,很多企业在前期搭建了很多的IT系统,系统间像烟囱一样相互独立。在面对着越来越复杂的业务,越来越多的数据,企业IT在扩展旧系统上出现了一定的局限,从而产生不断的重复建设的问题,企业需要制定数字转型...
    99+
    2017-02-13
    数据中台架构体系浅析
  • 谈谈数据中台技术体系
    昀哥 20191109 我们做大数据很早,2011年、2012年就开始了,到现在基本形成了一整套完整的数据中台体系。大数据基本为这三件事服务: 1.决策依据和经营分析 2.运营调度 3.外部机构尽职调查和穿刺 各个公司各条业务线对数据高度敏...
    99+
    2021-07-31
    谈谈数据中台技术体系
  • vue 中怎么请求后台数据
    这篇文章给大家介绍vue 中怎么请求后台数据,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。在入口函数中加入import VueResource from ...
    99+
    2024-04-02
  • Java中怎么从控制台中读取数据
    这篇文章给大家介绍Java中怎么从控制台中读取数据,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。1 JDK 1.4及以下版本读取的方法JDK 1.4及以下的版本中要想从控制台中输入数据只有一种办法,即使用System....
    99+
    2023-06-17
  • 计算机中笔记本和台式电脑的内存条可以通用吗
    这篇文章将为大家详细讲解有关计算机中笔记本和台式电脑的内存条可以通用吗,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。大部分笔记本电脑的内存条和台式机是不能通用的,因为两者卡槽不同。但有少部分笔记本为了降低...
    99+
    2023-06-06
  • 数据中台全景架构及模块解析!一文入门中台架构师!
    回顾一下,第一篇文章大白话 六问数据中台!你想知道的都在这了!。把数据中台是什么?为什么?有什么价值?说的明明白白。数据中台是企业级能力复用平台,目标是让数据持续用起来,通过数据中台提供的工具、方法和运行机制,把数据变为一种服务能...
    99+
    2021-01-26
    数据中台全景架构及模块解析!一文入门中台架构师!
  • 学习笔记:如何在Go中使用Laravel ORM来管理数据库?
    Laravel ORM是一个非常流行的PHP框架,它提供了一种方便的方式来管理数据库。但是,如果你正在使用Go语言开发应用程序,你可能会感到困惑:如何在Go中使用Laravel ORM来管理数据库呢? 在本文中,我们将介绍如何在Go中使用...
    99+
    2023-08-16
    laravel 学习笔记 shell
  • 一次tomcat源码启动控制台中文乱码的调试过程记录
    发现问题 今天准备学习下tomcat源码,于是从官网下载了tomcat的源码,导入到IDEA中,使用maven工具build完项目之后,启动项目,控制台打印了tomcat日志,但是中...
    99+
    2024-04-02
  • 如何在java控制台中接收数据
    如何在java控制台中实现接收数据?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。java从控制台接收一个数字的实例详解功能:从控制台接收一个数实现代码:import&nbs...
    99+
    2023-05-31
    java ava 台中
  • 国企如何进行数据中台建设?
    国企如何进行数据中台建设?最近一位国企的技术线领导问我:”茂森,像我们这样的国企应该怎样做中台建设呢?”说实话,以前还从来没有想过这个问题,当时只能从一些比较泛的角度做了一些回答。回家后对党的理论、政策做了一些学习,结合起在阿里、滴滴做数据...
    99+
    2023-06-05
  • vue中mock数据模拟后台接口的方法
    这篇文章主要讲解了“vue中mock数据模拟后台接口的方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“vue中mock数据模拟后台接口的方法”吧!在前端开发过程中,有后台配合是很必要的。但...
    99+
    2023-06-29
  • vue中mock数据,模拟后台接口实例
    目录一、mock文件二、第三方接口eolinker在前端开发过程中,有后台配合是很必要的。但是如果自己测试开发,或者后台很忙,没时间,那么我们需要自己提供或修改接口。 下面提供两种方...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作