返回顶部
首页 > 资讯 > 精选 >大数据的数仓平台设计思路是什么
  • 568
分享到

大数据的数仓平台设计思路是什么

2023-06-05 06:06:27 568人浏览 安东尼
摘要

这篇文章主要讲解了“大数据的数仓平台设计思路是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“大数据的数仓平台设计思路是什么”吧!下图为数仓整体的技术架构:一个优秀可靠的数仓,一定要结构、

这篇文章主要讲解了“大数据的数仓平台设计思路是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“大数据的数仓平台设计思路是什么”吧!

下图为数仓整体的技术架构

大数据的数仓平台设计思路是什么

一个优秀可靠的数仓,一定要结构、分层清晰,而不是越多的分层和主题越好,保障清晰的状态下,能够快速找到数据的位置。主题域的划分,完全可按照公司内部的业务线和结构去划分。

图中BDL层,作为缓冲数据层,其实就是贴数据层,和源数据表相同的表。直接用源库(传统关系型业务库)抽取数据,只存每天最新的数据快照(主要是增量数据)

BAK层是BDL层抽数,保存的是全历史业务数据,起备份和查错的作用。

FDL层是基础数据层,是基于主题、数仓模型开发的基础数据表。这里主要用到了范式建模法和维度建模法(即星型模型)包含最细粒度的数据,故称基础数据层,通俗的理解,这才是整个数仓的最核心的基础数据层,因为BAK层和BDL层的数据表结构跟业务库的数据是完全一致的,而FDL层的数据才是开始进行真正意义上的第一次清洗,不要的字段去除,不规范的字段命名去除,统一数据,规范标准化的一个过程。

GDL层是通用数据层,就是宽表层。也是基于主题、数仓模型开发的宽表。可能会牺牲第三范式,将相关的各维度或属性整合到一张表里。这种表的特点就是字段较多,数据量较大,但它能帮助消除重复查询。由于这种表会被各种需求用到,故称通用数据层。

ADL层是汇总数据层,是基于主题、数仓模型开发的汇总数据表。这里只用到维度建模法(即星型模型)。指标库可以放到这一层。

APP层是开放给用户,用户可以在此层自己开发数据,提数。给用户的脱敏数据也可以放到这一层。我们开发的数据产品所需数据也可以在这一层做。

还有两层比较特殊: 
一个是TMP(临时层),说白了就是存储中间结果表,有些业务场景比较复杂,需要拆表,多次计算,要用到一些中间结果集表,因此这层也是辅助层。

DIM层是维表层,各种时间维,省市区维度都可以存放,根据公司的业务形态去划分,ADL层可以跟DIM层的多维度关联,做各种报表,手到擒来。

以下是数据仓库数据流架构图: 
大数据的数仓平台设计思路是什么

感谢各位的阅读,以上就是“大数据的数仓平台设计思路是什么”的内容了,经过本文的学习后,相信大家对大数据的数仓平台设计思路是什么这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

--结束END--

本文标题: 大数据的数仓平台设计思路是什么

本文链接: https://lsjlt.com/news/241583.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 大数据的数仓平台设计思路是什么
    这篇文章主要讲解了“大数据的数仓平台设计思路是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“大数据的数仓平台设计思路是什么”吧!下图为数仓整体的技术架构:一个优秀可靠的数仓,一定要结构、...
    99+
    2023-06-05
  • 大数据总线平台DBus设计思路与工作原理
    大数据总线平台DBus设计思路与工作原理,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。一、背景企业中大量业务数据保存在各个业务系统数据库中,过去通常的同步数据的...
    99+
    2023-06-02
  • [平台建设] 日志数据同步数仓设计
    本文主要针对日志数据接入数据仓库场景进行设计, 同时介绍了下在设计接入时的一些细节,针对可能出现的问题进行必要的处理. 背景 主要针对用户流量数据、风控数据、人物画像等数据进行同步至数仓, 制...
    99+
    2019-01-19
    [平台建设] 日志数据同步数仓设计
  • Wormhole大数据流式处理平台的设计思想是怎样的
    本篇文章为大家展示了Wormhole大数据流式处理平台的设计思想是怎样的,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。导读:互联网的迅猛发展使得数据不再昂贵,而如何从数据中更快速获取价值变得日益重要...
    99+
    2023-06-19
  • 大数据分析平台系统开发思路及步骤是什么
    这篇文章给大家介绍大数据分析平台系统开发思路及步骤是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。1、搭建大数据平台离不开BI。在大数据之前,BI就已经存在很久了,简单把大数据等同于BI,明显是不恰当的。但两者又是...
    99+
    2023-06-19
  • 如何进行大数据平台架构的设计
    本篇文章为大家展示了如何进行大数据平台架构的设计,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。  关于大数据平台架构的设计探究。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面...
    99+
    2023-06-02
  • Salesforce平台支持多租户Multi tenant的核心设计思路是什么
    本篇文章给大家分享的是有关Salesforce平台支持多租户Multi tenant的核心设计思路是什么,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。多租户技术是云用于经济高效...
    99+
    2023-06-03
  • 大数据分析的常见思路是什么
    大数据分析的常见思路是什么,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。数据分析的常见思路,是具有指导意义的方法论,可以指导读者往哪些方向分析数据。但不限于数据分析,这些思路,...
    99+
    2023-06-19
  • web自动化平台开发元数据的设计方法是是什么
    这篇“web自动化平台开发元数据的设计方法是是什么”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“web自动化平台开发元数据的...
    99+
    2023-06-04
  • 紫金大数据平台架构之路(一)-
    一、总体设计 初来公司时,公司还没有大数据,我是作为大数据架构师招入的,结合公司的线上和线下业务,制定了如下的大数据架构路线图。 二、大数据任务开发和调度平台架构设计 在设计完总体架构后,并且搭建完hadoop/yarn的大数据...
    99+
    2014-06-23
    紫金大数据平台架构之路(一)-
  • fork/join的设计思路是什么
    本篇内容主要讲解“fork/join的设计思路是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“fork/join的设计思路是什么”吧!1、fork/join的设计思路了解一个框架的第一件事,...
    99+
    2023-06-16
  • 关系数据库的设计思想是什么
    本篇内容介绍了“关系数据库的设计思想是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!在计算机领域有许多...
    99+
    2024-04-02
  • 云计算和大数据指的是什么意思
    这篇文章主要介绍云计算和大数据指的是什么意思,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!云计算是指通过大量在云端的计算资源进行计算,再将结果返回给用户。大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处...
    99+
    2023-06-14
  • 搭建大数据分析平台的必要性是什么
    这篇文章将为大家详细讲解有关搭建大数据分析平台的必要性是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。  大数据时代,几乎每一个企业都对数据分析平台趋之若鹜,尤其是在今年疫情爆发之后,更...
    99+
    2023-06-02
  • 大数据是什么意思
    本篇内容介绍了“大数据是什么意思”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!大数据放在现在来讲,已经有不少比较成熟的理论、方法以及工具,已...
    99+
    2023-06-02
  • DKHadoop大数据平台架构有什么用
    这篇文章主要介绍了DKHadoop大数据平台架构有什么用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。大快Dkhadoop,可以说是集成了整个HADOOP生态系统的全部组件,...
    99+
    2023-06-02
  • 大数据环境下互联网行业数据仓库/数据平台的架构之漫谈
    导读:整体架构数据采集数据存储与分析数据共享数据应用实时计算任务调度与监控元数据管理总结一直想整理一下这块内容,既然是漫谈,就想起什么说什么吧。我一直是在互联网行业,就以互联网行业来说。先大概列一下互联网行业数据仓库、数据平台的用途:整合公...
    99+
    2023-06-05
  • 大数据时代书中的大数据是什么意思
    这篇文章主要为大家展示了“大数据时代书中的大数据是什么意思”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“大数据时代书中的大数据是什么意思”这篇文章吧。“大数据时代”一书中的大数据是指“全体数据或...
    99+
    2023-06-29
  • 数据库设计大师之路:数据库设计工具的指南针
    数据库设计是软件开发过程中的一项至关重要的任务,它定义了数据的存储和检索方式。合适的数据库设计工具可以显著提高数据库设计的质量和效率。 数据库设计工具的类型 数据库设计工具分为两大类: 视觉化工具:允许用户通过图形界面设计数据库模式,提...
    99+
    2024-03-10
    引言
  • 运维平台的建设思考-元数据管理(三)
    继第一篇,第二篇介绍了关于元数据的一些想法,最近做了一些改进。 对于一部分的元数据抽取大体有下面的两种方式。假设数据源已经做了很大的努力,终于统一起来了。我们现在要通过ssh的方式从源端抽取出数据来。 一种...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作