首页 > 资讯 > 数据库 >HBase Client API 简析

790

分享到

HBase Client API 简析

2024-04-02 19:04:59 790人浏览泡泡鱼

摘要

昨天在飞机上的2个小时看了一遍HBase的Client api，有几点心得：1.在Put小记录时最好关闭autoFlush，并合理设置WriterBuffer：因为每次Put都要进行一次rpc调用+WAL（

昨天在飞机上的2个小时看了一遍HBase的Client api，有几点心得：

1.在Put小记录时最好关闭autoFlush，并合理设置WriterBuffer：

因为每次Put都要进行一次rpc调用+WAL（关闭对写入提升非常大）+Server端处理，如果对于大批量小数据写入的话RPC的RTT消耗的时间就会成为写入的损耗点，因此可以通过本地缓冲批量提交的方式；默认的WriteBuffer大小是2MB，当autoFlush关闭时，客户端每次put都会写入到一个ArrayList内，每10次检查一次，当size超过WriteBuffer size时则进行一次flushCommit，会将WB的Put按照RS进行分组，每个RS进行一次RPC调用处理；

当提交到Server端后，如果发生异常，则会将WB中已经写入的Put删除，保留提交失败的进行异常处理；

不过WB的大小需要合理设置，因为占用本地和RS的内存.

本地内存占用很好估计，而服务端的内存最大消耗则是：hbase.client.write.buffer * hbase.regionserver.handler.count * number ofregion server

2.Scanner的batch/cache设置：

Scan具体的处理流程如下图：

HBase Client API 简析

Caching的设置主要影响RSnext的调用(可以理解成面向“行”的batch)，而batch则是RSRegionScanner每次nextInternal获取的keyvalue数（可以理解成面向“列”的batch）；

因此具体SCAN调用RPC次数由两个参数共同决定=cells总数/（caching*min(batch,cells/row)）；

那这里scanner的next(n)其实和Mysql JDBC里的fetch类似，其实是在客户端loop模拟的，而不是真的在server端进行batch fetch，其实这里的scan和mysql 里的cursor是非常类似的，因此理解了一个理解另外一个就是水到渠成了.

不过这里也有WB同样的问题就是内存消耗，以及网络传输,处理完毕时及时关闭.

3.HConnection的处理：

简称HC，都是由shared的HCManager产生，而一个HC是存储在HCManager的HBASE_INSTANCES的MAP类型里，也就是说同一个Client+Conf是共享HC的，这样有个好处就是首先共享了 ZK连接，其实就是在split/merge时只对一个HC进行metadata refresh就OK了.

缺点就是这些连接会一直保持到客户端进程退出，会导致ZK连接超maxClientCnxns异常.

4.Coprocessor：

类似对比Mysql的trigger和procedure.稍候再详细介绍

5.Counter

这个计数器非常好用，不过用HBase做计数compared to Redis是不是略重了：P

6.RowLock

这个应该是被禁用掉的东西，RS杀手啊...可以把rpc handler hold住lease.period...

7.管理API：

Split/Compact 运维利器:)

您可能感兴趣的文档:

--结束END--

本文标题: HBase Client API 简析

本文链接: https://lsjlt.com/news/36558.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

编程网，编程工程师的家园，是目前国内优秀的开源技术社区之一，形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容，为IT开发者提供了一个发现、使用、并交流开源技术的平台。

官方手机版
微信公众号
商务合作

HBase Client API 简析

HBase Client API 简析

Jave Hbase API

HBase简介

java操作hbase api

ElasticSearch8.x和Java API Client

HBase API 操作范例

HBase JAVA API使用（2.1.0-cdh6.2.0）

hbase 2.0.2 java api怎么用

hbase ORM simplehbase v0.6简介

hbase访问方式之java api

Hbase架构剖析

HBase BucketAllocatorException 异常剖析

HBase WAL源码分析

python 调用HBase的简单实例

.NET Core实现简单的Redis Client框架

HBase的Hlog原理解析

Go中http client的示例分析

Android编程实现简单的UDP Client实例

Golang简单实现http的server端和client端

HBase架构深入解析(一)

关于SQL建表语句使用详解

HBase在大数据审计与合规性追踪中的应用

MySQL与HBase在大数据金融分析中的性能与可扩展性对比

HBase的Region Server之间的网络通信优化

HBase在大数据监控与告警系统中的实时数据处理能力

MySQL与HBase在大数据安全策略中的实现与对比

HBase的分布式事务处理在复杂业务场景中的应用

MySQL与HBase在混合存储架构中的整合策略

HBase如何支持高效的二级索引查询

MySQL与HBase在物联网数据收集与处理中的协作模式