返回顶部
首页 > 资讯 > 数据库 >OLAP、OLTP的介绍和比较
  • 358
分享到

OLAP、OLTP的介绍和比较

2024-04-02 19:04:59 358人浏览 泡泡鱼
摘要

转: https://www.cnblogs.com/hhandbibi/p/7118740.html OLTP与OLAP的介绍     数据处理大致可以分成两大

转: https://www.cnblogs.com/hhandbibi/p/7118740.html


OLTP与OLAP的介绍

    数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)。OLTP是传统的关系型 数据库 的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。 

OLTP  系统强调数据库内存效率,强调内存各种指标的命令率,强调绑定变量,强调并发操作;
OLAP  系统则强调数据分析,强调sql执行市场,强调磁盘I/O,强调分区等。 

OLTP与OLAP之间的比较 :   

OLAP、OLTP的介绍和比较

     OLTP,也叫联机事务处理(Online Transaction Processing) ,表示事务性非常高的系统,一般都是高可用的在线系统,以小的事务以及小的查询为主,评估其系统的时候,一般看其每秒执行的Transaction以及Execute SQL的数量。在这样的系统中,单个数据库每秒处理的Transaction往往超过几百个,或者是几千个,Select 语句的执行量每秒几千甚至几万个。典型的OLTP系统有电子商务系统、银行、证券等,如美国eBay的业务数据库,就是很典型的OLTP数据库。
OLTP系统最容易出现瓶颈的地方就是CPU与磁盘子系统。
(1)CPU出现瓶颈常表现在逻辑读总量与计算性函数或者是过程上,逻辑读总量等于单个语句的逻辑读乘以执行次数,如果单个语句执行速度虽然很快,但是执行次数非常多,那么,也可能会导致很大的逻辑读总量。设计的方法与优化的方法就是减少单个语句的逻辑读,或者是减少它们的执行次数。另外,一些计算型的函数,如自定义函数、decode等的频繁使用,也会消耗大量的CPU时间,造成系统的负载升高,正确的设计方法或者是优化方法,需要尽量避免计算过程,如保存计算结果到统计表就是一个好的方法。
(2)磁盘子系统在OLTP环境中,它的承载能力一般取决于它的IOPS处理能力. 因为在OLTP环境中,磁盘物理读一般都是db file sequential read,也就是单块读,但是这个读的次数非常频繁。如果频繁到磁盘子系统都不能承载其IOPS的时候,就会出现大的性能问题。
    OLTP比较常用的设计与优化方式为Cache技术与B-tree索引技术,Cache决定了很多语句不需要从磁盘子系统获得数据,所以,WEB cache与oracle data buffer对OLTP系统是很重要的。另外,在索引使用方面,语句越简单越好,这样执行计划也稳定,而且一定要使用绑定变量,减少语句解析,尽量减少表关联,尽量减少分布式事务,基本不使用分区技术、MV技术、并行技术及位图索引。因为并发量很高,批量更新时要分批快速提交,以避免阻塞的发生。 
OLTP 系统是一个数据块变化非常频繁,SQL 语句提交非常频繁的系统。 对于数据块来说,应尽可能让数据块保存在内存当中,对于SQL来说,尽可能使用变量绑定技术来达到SQL重用,减少物理I/O 和重复的SQL 解析,从而极大的改善数据库的性能。
    这里影响性能除了绑定变量,还有可能是热快(hot block)。 当一个块被多个用户同时读取时,Oracle 为了维护数据的一致性,需要使用Latch来串行化用户的操作。当一个用户获得了latch后,其他用户就只能等待,获取这个数据块的用户越多,等待就越明显。 这就是热快的问题。 这种热快可能是数据块,也可能是回滚端块。 对于数据块来讲,通常是数据库的数据分布不均匀导致,如果是索引的数据块,可以考虑创建反向索引来达到重新分布数据的目的,对于回滚段数据块,可以适当多增加几个回滚段来避免这种争用。 
     OLAP,也叫联机分析处理(Online Analytical Processing) 系统,有的时候也叫DSS决策支持系统,就是我们说的数据仓库。在这样的系统中,语句的执行量不是考核标准,因为一条语句的执行时间可能会非常长,读取的数据也非常多。所以,在这样的系统中,考核的标准往往是磁盘子系统的吞吐量(带宽),如能达到多少MB/s的流量。
    磁盘子系统的吞吐量则往往取决于磁盘的个数,这个时候,Cache基本是没有效果的,数据库的读写类型基本上是db file scattered read与direct path read/write。应尽量采用个数比较多的磁盘以及比较大的带宽,如4Gb的光纤接口。
在OLAP系统中,常使用分区技术、并行技术。
    分区技术在OLAP系统中的重要性主要体现在数据库管理上,比如数据库加载,可以通过分区交换的方式实现,备份可以通过备份分区表空间实现,删除数据可以通过分区进行删除,至于分区在性能上的影响,它可以使得一些大表的扫描变得很快(只扫描单个分区)。另外,如果分区结合并行的话,也可以使得整个表的扫描会变得很快。总之,分区主要的功能是管理上的方便性,它并不能绝对保证查询性能的提高,有时候分区会带来性能上的提高,有时候会降低。
    并行技术除了与分区技术结合外,在Oracle 10g中,与RAC结合实现多节点的同时扫描,效果也非常不错,可把一个任务,如select的全表扫描,平均地分派到多个RAC的节点上去。
    在OLAP系统中,不需要使用绑定(BIND)变量,因为整个系统的执行量很小,分析时间对于执行时间来说,可以忽略,而且可避免出现错误的执行计划。但是OLAP中可以大量使用位图索引,物化视图,对于大的事务,尽量寻求速度上的优化,没有必要像OLTP要求快速提交,甚至要刻意减慢执行的速度。
    绑定变量真正的用途是在OLTP系统中,这个系统通常有这样的特点,用户并发数很大,用户的请求十分密集,并且这些请求的SQL 大多数是可以重复使用的。
    对于OLAP系统来说,绝大多数时候数据库上运行着的是报表作业,执行基本上是聚合类的SQL 操作,比如group by,这时候,把优化器模式设置为all_rows是恰当的。 而对于一些分页操作比较多的网站类数据库,设置为first_rows会更好一些。 但有时候对于OLAP 系统,我们又有分页的情况下,我们可以考虑在每条SQL 中用hint。 如:
    Select  a.* from table a;
分开设计与优化
    在设计上要特别注意,如在高可用的OLTP环境中,不要盲目地把OLAP的技术拿过来用。
    如分区技术,假设不是大范围地使用分区关键字,而采用其它的字段作为where条件,那么,如果是本地索引,将不得不扫描多个索引,而性能变得更为低下。如果是全局索引,又失去分区的意义。
    并行技术也是如此,一般在完成大型任务时才使用,如在实际生活中,翻译一本书,可以先安排多个人,每个人翻译不同的章节,这样可以提高翻译速度。如果只是翻译一页书,也去分配不同的人翻译不同的行,再组合起来,就没必要了,因为在分配工作的时间里,一个人或许早就翻译完了。
    位图索引也是一样,如果用在OLTP环境中,很容易造成阻塞与死。但是,在OLAP环境中,可能会因为其特有的特性,提高OLAP的查询速度。MV也是基本一样,包括触发器等,在DML频繁的OLTP系统上,很容易成为瓶颈,甚至是Library Cache等待,而在OLAP环境上,则可能会因为使用恰当而提高查询速度。
    对于OLAP系统,在内存上可优化的余地很小,增加CPU 处理速度和磁盘I/O 速度是最直接的提高数据库性能的方法,当然这也意味着系统成本的增加。      
    比如我们要对几亿条或者几十亿条数据进行聚合处理,这种海量的数据,全部放在内存中操作是很难的,同时也没有必要,因为这些数据快很少重用,缓存起来也没有实际意义,而且还会造成物理I/O相当大。 所以这种系统的瓶颈往往是磁盘I/O上面的。
    对于OLAP系统,SQL 的优化非常重要,因为它的数据量很大,做全表扫描和索引对性能上来说差异是非常大的。
其他
    Oracle 10g以前的版本建库过程中可供选择的模板有:
        Data Warehouse (数据仓库)
        General Purpose  (通用目的、一般用途)
        New Database
        Transaction Processing  (事务处理)
    Oracle 11g的版本建库过程中可供选择的模板有:
        一般用途或事务处理
        定制数据库

        数据仓库

个人对这些模板的理解为:

     联机分析处理(OLAP,On-line Analytical Processing),数据量大,DML少。使用数据仓库模板
     联机事务处理(OLTP,On-line Transaction Processing),数据量少,DML频繁,并行事务处理多,但是一般都很短。使用一般用途或事务处理模板。

     决策支持系统(DDS,Decision support system),典型的操作是全表扫描,长查询,长事务,但是一般事务的个数很少,往往是一个事务独占系统。

您可能感兴趣的文档:

--结束END--

本文标题: OLAP、OLTP的介绍和比较

本文链接: https://lsjlt.com/news/45212.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • OLAP、OLTP的介绍和比较
    转: https://www.cnblogs.com/hhandbibi/p/7118740.html OLTP与OLAP的介绍     数据处理大致可以分成两大...
    99+
    2024-04-02
  • OLTP和OLAP的区别
    OLTP和OLAP的区别 联机事务处理OLTP(on-line transaction processing) 主要是执行基本日常的事务处理,比如数据库记录的增删查改。比如在银行的一笔交易记录,就是一个典型...
    99+
    2024-04-02
  • oltp和olap的概念是什么
    OLTP(在线事务处理)和OLAP(在线分析处理)是数据处理领域中常用的两个概念。OLTP是指用于处理实时事务的数据库和系统。它主要...
    99+
    2023-10-12
    oltp olap
  • shell的比较运算介绍
    shell字符串比较、判断是否为数字 二元比较操作符,比较变量或者比较数字.注意数字与字符串的区别. 整数比较 -eq 等于,如:if [ "$a" -eq "$b" ] -ne 不等于,如:if [ "$...
    99+
    2022-06-04
    shell
  • DB、DW、DM、ODS、OLAP、OLTP和BI的概念是什么
    DB、DW、DM、ODS、OLAP、OLTP和BI的概念是什么,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。今天特地查了一些官方解释和很多优秀的博客文章,将关于数仓方面的一些名...
    99+
    2023-06-19
  • 国内比较好的CRM系统介绍
    CRM(Customer RelationshipManagement)系统是一种用于管理企业与客户之间关系的软件工具。随着市场竞争的日益激烈,企业越来越重视客户关系的管理和维护。而选择一款适合企业的CRM系统对于提高客户满意度、提升销售...
    99+
    2024-01-18
    比较好 国内 系统
  • Golang中常用的工具和框架介绍与比较
    Golang是一种快速、高效、可靠的编程语言,越来越受到开发者的青睐。在Golang的开发过程中,我们通常会使用一些工具和框架来提高效率和简化开发。本文将介绍一些Golang中常用的工...
    99+
    2024-02-28
    工具 框架 golang go语言
  • OLAP和OLTP的本质区别,一篇文章讲明白
    OLAP(联机分析处理)和OLTP(联机事务处理)是两种不同的数据库处理方式,各自适用于不同的业务需求。下面是一篇文章,将详细讲解O...
    99+
    2023-09-22
    OLAP
  • Python中的比较运算符用法介绍
    这篇文章主要介绍“Python中的比较运算符用法介绍”,在日常操作中,相信很多人在Python中的比较运算符用法介绍问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python中的比较运算符用法介绍”的疑惑有所...
    99+
    2023-06-02
  • 详解css中的比较函数(示例介绍)
    以上就是详解css中的比较函数(示例介绍)的详细内容,更多请关注编程网其它相关文章!...
    99+
    2022-11-22
    css
  • goget和goinstall对比介绍
    目录一、问题背景二、原因探究(一)命令定义和区别(二)go get 是否包含了 go install(三)为什么要用 go install一、问题背景 安装Go库db2struct时...
    99+
    2023-05-16
    go get go install go install和go get对比
  • linux shell中的比较符号与特殊符号介绍
    shell字符串比较、判断是否为数字 二元比较操作符,比较变量或者比较数字。注意数字与字符串的区别。 整数比较 -eq 等于,如:if [ "$a" -eq "$b" ] -ne 不等于,如:if [ "$...
    99+
    2022-06-04
    符号 特殊符号 linux
  • JavaScript中的4 个相等比较算法的简单介绍
    这篇文章主要讲解了“JavaScript中的4 个相等比较算法的简单介绍”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“JavaScript中的4 个相等比较...
    99+
    2024-04-02
  • CSS中的选择器种类介绍及效率的比较
    这篇文章主要讲解了“CSS中的选择器种类介绍及效率的比较”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“CSS中的选择器种类介绍及效率的比较”吧!我们都知道,...
    99+
    2024-04-02
  • win8系统为什么用的人比较少的详细介绍
    为什么win8系统很少有人用?许多比较熟悉电脑的用户都知道,Windows操作系统有非常的多,现在连win7、winXP都有许多用户在使用,而win8系统却没人使用,这是因为win8系统相当于一个失败品,拥有着很多缺陷,下面小编就带着大家一...
    99+
    2023-07-13
  • Vue和React的比较
    这篇文章主要讲解了“Vue和React的比较”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Vue和React的比较”吧!在过去的 5 年中,我一直是一名 R...
    99+
    2024-04-02
  • 阿里云ECS4G内存的详细介绍及与其他内存的比较
    随着云计算的发展,阿里云作为国内领先的云服务商,提供了丰富的云产品和服务。其中,阿里云ECS( Elastic ComputeService)是其主要的云服务器产品之一。本文将详细介绍阿里云ECS4G内存的性能和特点,并与其他内存进行比较...
    99+
    2023-10-30
    内存 阿里 详细介绍
  • Java和JavaScript的比较(转)
    *Netscape 把 Livescript 改名为 Javascript , 这是Java的一个有趣的变异, 用于客户一方的用户化 *用Java 进行细节编程, 而JavaScript 用于客户接口和系统的全部综合 *JavaScript...
    99+
    2023-06-03
  • MYSQL 数据库时间字段 INT,TIMESTAMP,DATETIME 性能效率的比较介绍
    目录一、准备工作1.1 建表1.2 插入100万条测试数据二、MyISAM引擎2.1 MyISAM 引擎无索引下的 dint/dtimestamp/d_datetime2.1.1 int 类型是否调用 Unix_TIME...
    99+
    2024-04-02
  • MYSQL 数据库时间字段 INT,TIMESTAMP,DATETIME 性能效率的比较介绍
    目录一、准备工作1.1 建表1.2 插入100万条测试数据二、MyISAM引擎2.1 MyISAM 引擎无索引下的 dint/dtimestamp/d_datetime2.1.1 i...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作