返回顶部
首页 > 资讯 > 数据库 >HBase Client API 简析
  • 790
分享到

HBase Client API 简析

2024-04-02 19:04:59 790人浏览 泡泡鱼
摘要

昨天在飞机上的2个小时看了一遍HBase的Client api,有几点心得:1.在Put小记录时最好关闭autoFlush,并合理设置WriterBuffer:因为每次Put都要进行一次rpc调用+WAL(

昨天在飞机上的2个小时看了一遍HBase的Client api,有几点心得:

1.在Put小记录时最好关闭autoFlush,并合理设置WriterBuffer:

因为每次Put都要进行一次rpc调用+WAL(关闭对写入提升非常大)+Server端处理,如果对于大批量小数据写入的话RPC的RTT消耗的时间就会成为写入的损耗点,因此可以通过本地缓冲批量提交的方式;默认的WriteBuffer大小是2MB,当autoFlush关闭时,客户端每次put都会写入到一个ArrayList内,每10次检查一次,当size超过WriteBuffer size时则进行一次flushCommit,会将WB的Put按照RS进行分组,每个RS进行一次RPC调用处理;

当提交到Server端后,如果发生异常,则会将WB中已经写入的Put删除,保留提交失败的进行异常处理;

不过WB的大小需要合理设置,因为占用本地和RS的内存.

本地内存占用很好估计,而服务端的内存最大消耗则是:hbase.client.write.buffer * hbase.regionserver.handler.count * number ofregion server

2.Scanner的batch/cache设置:

Scan具体的处理流程如下图:

HBase Client API 简析

Caching的设置主要影响RSnext的调用(可以理解成面向“行”的batch),而batch则是RSRegionScanner每次nextInternal获取的keyvalue数(可以理解成面向“列”的batch);

因此具体SCAN调用RPC次数由两个参数共同决定=cells总数/(caching*min(batch,cells/row));

那这里scanner的next(n)其实和Mysql JDBC里的fetch类似,其实是在客户端loop模拟的,而不是真的在server端进行batch fetch,其实这里的scan和mysql 里的cursor是非常类似的,因此理解了一个理解另外一个就是水到渠成了.

不过这里也有WB同样的问题就是内存消耗,以及网络传输,处理完毕时及时关闭.

3.HConnection的处理:

简称HC,都是由shared的HCManager产生,而一个HC是存储在HCManager的HBASE_INSTANCES的MAP类型里,也就是说同一个Client+Conf是共享HC的,这样有个好处就是首先共享了 ZK连接,其实就是在split/merge时只对一个HC进行metadata refresh就OK了.

缺点就是这些连接会一直保持到客户端进程退出,会导致ZK连接超maxClientCnxns异常.

4.Coprocessor:

类似对比Mysql的trigger和procedure.稍候再详细介绍

5.Counter

这个计数器非常好用,不过用HBase做计数compared to Redis是不是略重了:P

6.RowLock

这个应该是被禁用掉的东西,RS杀手啊...可以把rpc handler hold住lease.period...

7.管理API:

Split/Compact 运维利器:)


您可能感兴趣的文档:

--结束END--

本文标题: HBase Client API 简析

本文链接: https://lsjlt.com/news/36558.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • HBase Client API 简析
    昨天在飞机上的2个小时看了一遍HBase的Client API,有几点心得:1.在Put小记录时最好关闭autoFlush,并合理设置WriterBuffer:因为每次Put都要进行一次RPC调用+WAL(...
    99+
    2024-04-02
  • Jave Hbase API
    Hbase API 类和数据模型的对应关系       HBaseAdmin   类:org.apache.hadoop.hbase.client.HBaseAdmin 作用:提供了一个接口来管理 HBase 数据库的表信息。它提供的...
    99+
    2019-05-27
    Jave Hbase API
  • HBase简介
    一、简介   HBase是基于列存储、构建在HDFS上的分布式存储系统,其主要功能是存储海量结构化数据。      HBase构建在HDFS之上,...
    99+
    2024-04-02
  • java操作hbase api
    需要引入的jar包(这里的jar包括hbase,hive的UDF,hive的jdbc连接)java源码package com.hbase.jdbc; import java.util....
    99+
    2024-04-02
  • ElasticSearch8.x和Java API Client
    建议 建议直接阅读我的博客原文 10.4 Java API Client操作-索引库/文档 客户端更新 ES为不同语言提供了用于操作ES的客户端,截至2023年7月4日,根据官网Java REST C...
    99+
    2023-09-13
    java springcloud elasticsearch restful Java API Client
  • HBase API 操作范例
    package com.test.hbase.api;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.*...
    99+
    2024-04-02
  • HBase JAVA API使用(2.1.0-cdh6.2.0)
    集群版本:CDH6.2.0集群Hadoop版本:Hadoop 3.0.0-cdh6.2.0集群HBase版本:2.1.0-cdh6.2.0 操作系统:macOS 10.15.5 IntelliJ IDEA 版本:IntelliJ ...
    99+
    2015-09-01
    HBase JAVA API使用(2.1.0-cdh6.2.0)
  • hbase 2.0.2 java api怎么用
    这篇文章将为大家详细讲解有关hbase 2.0.2 java api怎么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。package com.hbase.test;import ja...
    99+
    2023-06-02
  • hbase ORM simplehbase v0.6简介
    https://github.com/zhang-xzhi/simplehbase/https://github.com/zhang-xzhi/simplehbase/wikisimplehbase是jav...
    99+
    2024-04-02
  • hbase访问方式之java api
    Hbase的访问方式Native Java API:最常规和高效的访问方式;HBase Shell:HBase的命令行工具,最简单的接口,适合HBase管理使用;Thrift Gateway:利用Thrift序列化技术,支持C++,PHP,...
    99+
    2023-05-31
    hbase java api
  • Hbase架构剖析
      HBase隶属于hadoop生态系统,它参考了谷歌的BigTable建模,实现的编程语言为 Java, 建立在hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。它仅能通过主键(row key)和主键的range来...
    99+
    2021-03-06
    Hbase架构剖析
  • HBase BucketAllocatorException 异常剖析
    近日,观察到HBase集群出现如下WARN日志: 2020-04-18 16:17:03,081 WARN [regionserver/xxx-BucketCacheWriter-1] bucket.BucketCache:F...
    99+
    2020-01-21
    HBase BucketAllocatorException 异常剖析
  • HBase WAL源码分析
    这篇文章主要讲解了“HBase WAL源码分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“HBase WAL源码分析”吧!WAL(Write-Ahead Logging)是数据库系统中保障...
    99+
    2023-06-03
  • python 调用HBase的简单实例
    新来的一个工程师不懂HBase,java不熟,python还行,我建议他那可以考虑用HBase的thrift调用,完成目前的工作。 首先,安装thrift 下载thrift,这里,我用的是thrift-0....
    99+
    2022-06-04
    实例 简单 python
  • .NET Core实现简单的Redis Client框架
    目录0,关于RedisRESP1,定义数据类型2,定义异步消息状态机3,定义命令发送模板4,定义RedisClient5,实现简单的RESP解析6,实现命令发送客户端7,如何使用8,...
    99+
    2024-04-02
  • HBase的Hlog原理解析
    // to do ...
    99+
    2024-04-02
  • Go中http client的示例分析
    这篇文章给大家分享的是有关Go中http client的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。什么是gogo是golang的简称,golang 是Google开发的一种静态强类型、编译型、并发型,...
    99+
    2023-06-15
  • Android编程实现简单的UDP Client实例
    本文实例讲述了Android编程实现简单的UDP Client。分享给大家供大家参考,具体如下: 该代码在4.2.2内调试通过 1.记得加权限 <uses-permis...
    99+
    2022-06-06
    udp Android
  • Golang简单实现http的server端和client端
    介绍 HTTPS (Secure Hypertext Transfer Protocol)安全超文本传输协议,是一个安全通信通道,它基于HTTP开发用于在客户计算机和服务器之间交换...
    99+
    2024-04-02
  • HBase架构深入解析(一)
    前记 公司内部使用的是MapR版本的Hadoop生态系统,因而从MapR的官网看到了这篇文文章: An In-Depth Look at the HBase Architecture ,原本...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作