首页 > 资讯 > 数据库 >大数据批量键值查询怎样才会更快

332

分享到

大数据批量键值查询怎样才会更快

大数据批量键值查询怎样才会更快 2016-08-06 17:08:08 332人浏览猪猪侠

摘要

一般选择数据库来存放数据，并借助数据表的索引来加快检索速度。利用索引查找数据，即使数据总量达到有10亿，对于单条记录的查找效率大约在数十毫秒（复杂度为LogN）。但是，如果需要查询的键值很多，比如多达几千甚至几万的时候，如果每次都独立查找，

大数据批量键值查询怎样才会更快

一般选择数据库来存放数据，并借助数据表的索引来加快检索速度。利用索引查找数据，即使数据总量达到有10亿，对于单条记录的查找效率大约在数十毫秒（复杂度为LogN）。但是，如果需要查询的键值很多，比如多达几千甚至几万的时候，如果每次都独立查找，那读取和比较也会累积到几万甚至几十万次，时间延迟由此也会涨到几十分钟甚至小时级别，这时候再简单地使用数据库索引对于用户体验必然是难以容忍的了。

比如下面这样的查询：

结构如下：

字段	类型	备注
id	long	1000000000001开始自增
data	string	随机字符串（长度为 180 字节）

对这样结构的6亿条数据，从中取1万个随机id对应的记录，用oracle大约就需要120 秒了。

使用的sql大概这样：select * from testdata where id in (…)

另外由于in中的个数最大1000个，还需要多次查询后的结果再合并，处理起来也比较麻烦。

同样的数据，用集算器来处理，代码简单且查找高效，看下面这个例子：

	A	B
1	=file("testdata.ctx").create()	//打开组表文件testdata.ctx
2	=A1.index@3(id_idx)	//加载三级索引
3	=keys	//待查找的随机键值序列
4	=A1.icursor(;A3.contain(id),id_idx)	//利用组表索引id_idx查找

这里使用了集算器组表功能，基于高性能索引和批量键值查找，可以有效地应对这种场景。该场景下，集算器查询仅用了20秒，相比Oracle的120秒提升了6倍。感兴趣可以参考：性能优化教案—查找

集算器还很容易嵌入到Java应用程序中，Java如何调用SPL脚本有使用和获得它的方法。

关于集算器安装使用、获得免费授权和相关技术资料，可以参见如何使用集算器。

您可能感兴趣的文档:

--结束END--

本文标题: 大数据批量键值查询怎样才会更快

本文链接: https://lsjlt.com/news/6705.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

大数据批量键值查询怎样才会更快

大数据批量键值查询怎样才会更快

大数据批量键值怎么快速查询

大数据分组怎样才会更快

sql怎么快速查询大量数据

Java导出大批量数据(分批查询导出篇)

MySQL中主键使用数字还是uuid会让查询更快

MySQL数据查询太多会怎么样

Java使用多线程做批处理（查询大量数据）

mysql大数据量查询怎么优化

SAP怎么实现批量查询序列号数据

SQLServer数据库怎么远程查询并批量导入数据

oracle怎么查询某张表的数据量大小

MySQL中怎样查看数据库表容量大小

laravel中怎么进行高效的大量数据查询

报表连 hive，数据量比较大，怎么分页查询？

批量更新几百万条数据，速度太慢怎么办？怎样做到优化？

怎样从生产数据库中获得想要的查询语句，把结果集批量插入到磁盘txt文件中

关于SQL建表语句使用详解

HBase在大数据审计与合规性追踪中的应用

MySQL与HBase在大数据金融分析中的性能与可扩展性对比

HBase的Region Server之间的网络通信优化

HBase在大数据监控与告警系统中的实时数据处理能力

MySQL与HBase在大数据安全策略中的实现与对比

HBase的分布式事务处理在复杂业务场景中的应用

MySQL与HBase在混合存储架构中的整合策略

HBase如何支持高效的二级索引查询

MySQL与HBase在物联网数据收集与处理中的协作模式