返回顶部
首页 > 资讯 > 数据库 >谈谈数据中台技术体系
  • 323
分享到

谈谈数据中台技术体系

谈谈数据中台技术体系 2021-07-31 03:07:12 323人浏览 无得
摘要

昀哥 20191109 我们做大数据很早,2011年、2012年就开始了,到现在基本形成了一整套完整的数据中台体系。大数据基本为这三件事服务: 1.决策依据和经营分析 2.运营调度 3.外部机构尽职调查和穿刺 各个公司各条业务线对数据高度敏

昀哥 20191109

我们做大数据很早,2011年、2012年就开始了,到现在基本形成了一整套完整的数据中台体系。大数据基本为这三件事服务:

1.决策依据和经营分析

2.运营调度

3.外部机构尽职调查和穿刺

各个公司各条业务线对数据高度敏感,尤其是打仗(有仗打仗,没仗造仗)的时候基本上是实时调度,加之公司多,数据来源多,机房多,交易量大(每日1000+万),实时性要求高,所以需要一套行之有效的数据中台来支撑。

 

首先,我们把大数据技术领域划分为六块,如下图所示。

  1. 元数据管理:分为技术元数据业务元数据。技术元数据描述数据仓库技术细节。业务元数据从商业和业务的角度描述数据仓库中的数据,使业务人员更好地、全面地理解数据仓库中分析出来的数据。其中最经典的场景就是血缘(动态)分析。

  2. 协作调度:不管是离线计算,还是实时计算,都需要一套调度和管理系统来帮助数据仓库工程师平滑地完成测试环境、生产环境的计算任务的打包、提交、测试、核验数据和发布。

  3. 自助分析:也可以叫即席查询。具有一定经验的运营人员或数据分析师可以利用自助BI系统完成数据提取、数据分析和展示,所见即所得。

  4. 数据可视化:指的是预先通过可视化系统配置好的各种监控大屏和经营分析报表。

  5. 运维监控告警:对集群组件安装和升级,对数据迁移,对集群运转情况,需要有一个能让运维人员和数据仓库工程师解脱出来的解决方案。

  6. 数据资产管理(含数据质量):在元数据管理基础之上,第一层需要数据质量保障,即有一套明确的保障机制,对生产出来的数据做校验,确保数据无误,否则就要找到数据失真的原因并告警。第二层是梳理盘点数据资产,准确计量数据资产,准确掌握数据资产的开放情况,形成治理闭环。

 

其次,我们的数据中台在最近两年发展得更有体系了,这与公司裂变、业务规模激增引发的,当然也跟我们高屋建瓴、高举高打分不开。

如果分层来划分的话,可以把工作成果分为业务交付和过程管控两啪,如下图所示。

简单做一个系统概述和技术栈说明:

业务交付:

-自助报表:自窝窝以来我们就有一套向导式的报表自助配置系统,绝大多数经营分析报表(一般是T+1数据汇总和明细)都是这么配置出来的,有汇总有明细有图有表有筛选有排序有导出。

-数屏:一种高逼格数据应用,它的目标是通过图形化界面快速搭建可视化监控大屏,数屏可以提供丰富的可视化数据组件,满足业务监控、会议展览、投资咨询等多种业务的展示需求,尤其要满足PC浏览器或者手机浏览器访问下的自适应布局。

-数据开放实验室:一种即席查询和自助分析系统,它的目标是将我们收集到的各种数据,授权下游企业使用,通过即席查询定义api,通过API获取数据,并进一步做可视化分析,制作报表。它的用户既有企业内部用户,也有企业外部用户。

-天演:不懂sql或是数据库结构的非技术人员,让他们能自由地上传临时数据、关联授权数据、探索数据,回答自己的问题,建立自己的个人数据工作台,有图有表能下钻,从宏观到微观。也因此数据查询交互速度要足够快,选Druid,杠杠的。

过程管控:

-魔盒:既然业务开发有研发协作平台、数据库自动化运维平台和运维自动化平台,那么大数据开发也肯定需要有一个协作平台。所谓协作平台,指的是围绕着四个核心概念(资源,数据,流程,操作)构建一个体系(资源能看见,流程能流转,数据能共享,操作有记录),流程驱动数据和资源,操作可视化和可追踪,形成闭环。底层实际是Azkaban。

-移山:异构数据源之间的数据迁移自动化平台,它旨在解决第三方数据接入、实时数据(单向/双向)同步、大数据集群间的数据迁移等问题。本质上是Canal和kafka

-磐石:基于Ambari的运维监控告警系统。

-能量块:元数据管理系统。

 

数据中台在整个大中台的位置如下图所示。

上面这套大中台体系,我们已经运转自如,大势已成。

-EOF-

 

欢迎关注公众号:老兵笔记

 

 

您可能感兴趣的文档:

--结束END--

本文标题: 谈谈数据中台技术体系

本文链接: https://lsjlt.com/news/2073.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 谈谈数据中台技术体系
    昀哥 20191109 我们做大数据很早,2011年、2012年就开始了,到现在基本形成了一整套完整的数据中台体系。大数据基本为这三件事服务: 1.决策依据和经营分析 2.运营调度 3.外部机构尽职调查和穿刺 各个公司各条业务线对数据高度敏...
    99+
    2021-07-31
    谈谈数据中台技术体系
  • 浅谈数据库防火墙技术及应用
    数据库防火墙仿佛是近几年来出现的一款新的安全设备,但事实上历史已经很长。2010年,Oracle公司在收购了Secerno公司,在2011年2月份正式发布了其数据库防火墙产品(database firewall),已经在市场上出现很多年头了...
    99+
    2023-06-03
  • PHP除以10000:浅谈大数据计算技术
    在当今信息化社会,数据已经成为无处不在的资产,越来越多的企业和机构开始关注如何处理和分析大规模的数据,以获取更多的商业价值。在大数据处理中,PHP这一被广泛应用的编程语言也逐渐展现出其...
    99+
    2024-03-07
    计算 技术 大数据
  • 谈谈Oracle 数据库的系统权限UNLIMITED TABLESPACE
    谈谈Oracle 数据库的系统权限UNLIMITED TABLESPACE作者:赵全文 网名:guest    前日上午,开发同学反馈,应用程序在连接一套Oracle 11.2.0.4....
    99+
    2024-04-02
  • 大数据技术体系介绍
    大数据技术体系是指在大数据环境下进行数据处理、存储、分析和挖掘的一系列技术方法和工具的集合体。大数据技术体系涵盖了数据采集、数据存储...
    99+
    2023-10-11
    大数据
  • 详细谈谈ES6中的symbol数据类型
    目录symbol数据类型symbol出现的原因Symbol特点symbol的应用在rb对象中添加up和down方法Symbol内置的属性值总结symbol数据类型 js语言中,ES...
    99+
    2024-04-02
  • 跨越数据库发展鸿沟,谈分布式数据库技术趋势
    金融行业架构转型需求随着移动化与互联网化的不断发展,我国金融行业的商业模式与技术体系已经逐渐走上了与西方世界完全不同的道路。众所周知,欧美国家的移动化普及率远远不如我国,同时人口基数也有着数量级的不同,这...
    99+
    2024-04-02
  • 数据库中间件漫谈
    1.前言 随着业务的发展,MySQL数据库中的表会越来越多,表中的数据量也会越来越大,相应地,数据操作的开销也会越来越大;另外,无论怎样升级硬件资源,单台服务器的资源(CPU、磁盘、内存、网络IO、事务数、连接数)总是有限的,最终数据库...
    99+
    2022-03-23
    数据库中间件漫谈
  • 简单谈谈Python中的几种常见的数据类型
    计算机顾名思义就是可以做数学计算的机器,因此,计算机程序理所当然地可以处理各种数值。但是,计算机能处理的远不止数值,还可以处理文本、图形、音频、视频、网页等各种各样的数据,不同的数据,需要定义不同的数据类型...
    99+
    2022-06-04
    几种 数据类型 常见
  • 好程序员技术分享浅谈JavaScript中的闭包
    好程序员技术分享浅谈JavaScript中的闭包,js闭包是指有权访问另一个函数作用域中的变量的函数,个人认为js闭包最大的用处就是防止对全局作用域的污染。 试想如果我们把一些仅仅只用到一两次的变量都声明在全局作用域中,最后肯定是容易出错且...
    99+
    2023-06-03
  • 数据中台架构体系浅析
    中台出现的背景 从技术上来看,随着业务的发展,很多企业在前期搭建了很多的IT系统,系统间像烟囱一样相互独立。在面对着越来越复杂的业务,越来越多的数据,企业IT在扩展旧系统上出现了一定的局限,从而产生不断的重复建设的问题,企业需要制定数字转型...
    99+
    2017-02-13
    数据中台架构体系浅析
  • 浅谈钩子技术在windows操作系统上的安全应用
    钩子技术在Windows操作系统上具有广泛的应用,包括安全领域。钩子技术可以用于监控和拦截系统中的各种操作,从而实现对系统的安全控制...
    99+
    2023-08-25
    Windows
  • 浅谈android中数据库的拷贝
    SQLiteDatabase不支持直接从assets读取文件,所以要提前拷贝数据库。在读取数据库时,先在项目中建立assets文件夹用于存放外部文件,将数据库文件拷到该目录下。...
    99+
    2022-06-06
    数据 拷贝 数据库 Android
  • Java 虚拟机之一:Java 技术体系与平台
    一:Java技术体系Sun官方所定义的Java技术体系包括:Java程序设计语言Java虚拟机Class文件格式Java API 核心类库第三方Java类库二: Java平台三:JREJava运行环境,包括JVM和Java核心类库,以及一些...
    99+
    2023-06-02
  • SPS技术体系之-----数据库表结构分析
    SPS安装完成后,在SQL Server中有四个与之相关的数据库:      SPS01_Config_db,SPS配置信息数据库 &n...
    99+
    2024-04-02
  • 浅谈MYSQL中数据类型和操作数据表
    小编这次要给大家分享的是浅谈MYSQL中数据类型和操作数据表,文章内容丰富,感兴趣的小伙伴可以来了解一下,希望大家阅读完这篇文章之后能够有所收获。数据类型和操作数据表1.1 MySQL类型之整型1.2 My...
    99+
    2024-04-02
  • 非关系型数据NoSQL 技术
         NoSQL(NoSQL = Not Only SQL ),意即反SQL运动,是一项全新的数据库革命性运动,早期就有人提出,发展至2009年趋势越发高涨。NoSQL的拥...
    99+
    2024-04-02
  • 大数据环境下互联网行业数据仓库/数据平台的架构之漫谈
    导读:整体架构数据采集数据存储与分析数据共享数据应用实时计算任务调度与监控元数据管理总结一直想整理一下这块内容,既然是漫谈,就想起什么说什么吧。我一直是在互联网行业,就以互联网行业来说。先大概列一下互联网行业数据仓库、数据平台的用途:整合公...
    99+
    2023-06-05
  • 浅谈微软和苹果各自的字体平滑,反锯齿,和次像素渲染技术
    苹果公司和微软公司,对于如何在电脑屏幕上显示字体,总是有不同看法。目前,这两家公司都使用次像素渲染(subpixel rend电脑屏幕上看,在不同的字体族(font family)之间,它会显示出更多的变化。原因是苹果公...
    99+
    2023-05-24
    微软 苹果 字体平滑 反锯齿 次像素渲染 像素 字体 渲染
  • 禧云数芯大数据平台技术白皮书
    白皮书作者:赵兴申 顾问:郑昀 出品方:禧云集团-基础技术中心-大数据与算法部   数据分析组:谭清勇、王明军、徐蕊、曹寿波 平台开发组:刘永飞、李喜延 数据可视化组:陈少明、董建昌 基础架构组:崔明黎、邱志伟、陈赏   第一章:...
    99+
    2019-09-25
    禧云数芯大数据平台技术白皮书
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作