返回顶部
首页 > 资讯 > 数据库 >greenplum分布键的hash值计算分析
  • 936
分享到

greenplum分布键的hash值计算分析

greenplum分布键的hash值计算分析 2017-05-26 20:05:25 936人浏览 绘本
摘要

greenplum 数据分布策略 greenplum 是一个 MPP 架构的数据库,由一个 master 和多个 segment 组成(还可选配置一个 standby master),其数据会根据设置的分布策略分布到在不同的 segmen

greenplum分布键的hash值计算分析

greenplum 数据分布策略

greenplum 是一个 MPP 架构数据库,由一个 master 和多个 segment 组成(还可选配置一个 standby master),其数据会根据设置的分布策略分布到在不同的 segment 上。

在 6 版本中,gp 提供了 3 个策略:随机分布、复制分布、hash 分布。

随机分布

在创建表的时候,使用 "DISTRIBUTED RANDOMLY" 子句。

该策略会使数据随机分布到各个 segment,即使是完全一样的两行数据,也可能会被分散至不同的 segment。虽然随机分布可以使数据平均的分散至所有的 segment(不会出现数据倾斜),但进行表关联分析时,仍然会按照关联键进行重分布数据,所以该策略在生产环境中很少使用。

复制分布

在创建表的时候,使用 "DISTRIBUTED REPLICATED" 子句。

该策略会把数据发送至所有的 segment,即所有的 segment 都拥有该表的所有数据,所以在表关联分析时,可以减少数据重分布,但该数据会保存到所有的 segment,所以会产生大量的重复数据。所以,该策略适合一些小表使用。

hash 分布

在重建表的时候,使用 "DISTRIBUTED BY (column,[...])" 子句。

该策略需要用户指定哪些列作为分布键,且分布键必须是主键的子集。gp 会根据分布键的值,进行计算得出 hash key 值,再根据该 key 值计算得出该数据被分配到哪个 segment上。用户可以结合自己的数据特点,以及以后数据分析的规律,为不同的表指定不同的分布键,以提供良好的数据存储以及数据分析性能。

hash 流程

这里直接贴出调用堆栈,重点分析 directDispatchCalculateHash 函数:

调用堆栈


#0  cdbhashinit (h=0x2e4e738) at cdbhash.c:161
#1  0x0000000000b05017 in directDispatchCalculateHash (plan=0x2e4dce8, targetPolicy=0x2e4e178, hashfuncs=0x2e4e6b8)
    at cdbmutate.c:197
#2  0x0000000000b0a989 in sri_optimize_for_result (root=0x2e4cf18, plan=0x2e4dce8, rte=0x2e4cd88,
    targetPolicy=0x7ffe5fca0ec0, hashExprs_p=0x7ffe5fca0ed0, hashOpfamilies_p=0x7ffe5fca0ec8) at cdbmutate.c:3560
#3  0x0000000000810d6e in adjust_modifytable_flow (root=0x2e4cf18, node=0x2e4e068, is_split_updates=0x2e4d9b8)
    at createplan.c:6608
#4  0x00000000008108bd in make_modifytable (root=0x2e4cf18, operation=CMD_INSERT, canSetTag=1 "01",
    resultRelations=0x2e4e038, subplans=0x2e4dfe8, withCheckOptionLists=0x0, returningLists=0x0,
    is_split_updates=0x2e4d9b8, rowMarks=0x0, epqParam=0) at createplan.c:6471
#5  0x0000000000817e24 in subquery_planner (glob=0x2cbcf70, parse=0x2d7cd80, parent_root=0x0, hasRecursion=0 "00",
    tuple_fraction=0, subroot=0x7ffe5fca11b8, config=0x2e4cee8) at planner.c:907
#6  0x0000000000816d1d in standard_planner (parse=0x2d7cd80, cursorOptions=0, boundParams=0x0) at planner.c:345
#7  0x0000000000816904 in planner (parse=0x2cbd080, cursorOptions=0, boundParams=0x0) at planner.c:200
#8  0x00000000008e8f4a in pg_plan_query (querytree=0x2cbd080, cursorOptions=0, boundParams=0x0) at postgres.c:959
#9  0x00000000008e8ffd in pg_plan_queries (querytrees=0x2d7b458, cursorOptions=0, boundParams=0x0) at postgres.c:1018
#10 0x00000000008ea3e8 in exec_simple_query (
    query_string=0x2cbc0d8 "insert INTO hash values (1,"asdf","fdsa","qwer");") at postgres.c:1748
#11 0x00000000008ef189 in PostgresMain (arGC=1, argv=0x2c9bc10, dbname=0x2c9bac0 "postgres",
    username=0x2c9baa8 "gpadmin") at postgres.c:5242
#12 0x000000000086db12 in BackendRun (port=0x2cc5830) at postmaster.c:4811
#13 0x000000000086d1da in BackendStartup (port=0x2cc5830) at postmaster.c:4468
#14 0x0000000000869424 in ServerLoop () at postmaster.c:1948
#15 0x00000000008689c3 in PostmasterMain (argc=6, argv=0x2c99c20) at postmaster.c:1518
#16 0x0000000000774e33 in main (argc=6, argv=0x2c99c20) at main.c:245

directDispatchCalculateHash

这里只贴出 directDispatchCalculateHash 函数的重点代码及注释:


static void
directDispatchCalculateHash(Plan *plan, GpPolicy *targetPolicy, Oid *hashfuncs)
{
	// .....以上代码省略

		// 为当前插入的数据会话创建 cdbHash 环境
		// 主要包括:
		// 1、当前 gp 的 segment 个数
		// 2、hash key 值到 segment 的 reduce 函数
		// 3、该表的分布键,以及该分布键类型对应计算 hash key 的函数
		h = makeCdbHash(targetPolicy->numsegments, targetPolicy->nattrs, hashfuncs);

		// 初始化 cdbHash,主要是初始化 hashkey 值
		cdbhashinit(h);

		// 遍历所有的分布键
		// nattrs 是分布键个数
		for (i = 0; i < targetPolicy->nattrs; i++)
		{
			// 进行 hash key 值计算
			cdbhash(h, i + 1, values[i], nulls[i]);
		}

		// 根据前面计算出来的 hash key, 
		// 再算出该数据数据应该映射到哪个 segment
		hashcode = cdbhashreduce(h);

	// ......以下代码省略
}

cdbhash

void
cdbhash(CdbHash *h, int attno, Datum datum, bool isnull)
{
	uint32		hashkey = h->hash;

	// ......省略一些非关键代码

		
		hashkey = (hashkey << 1) | ((hashkey & 0x80000000) ? 1 : 0);

		if (!isnull)
		{
			FunctionCallInfoData fcinfo;
			uint32		hkey;

			InitFunctionCallInfoData(fcinfo, &h->hashfuncs[attno - 1], 1,
									 InvalidOid,
									 NULL, NULL);

			fcinfo.arg[0] = datum;
			fcinfo.argnull[0] = false;

			hkey = DatumGetUInt32(FunctionCallInvoke(&fcinfo));

			
			if (fcinfo.isnull)
				elog(ERROR, "function %u returned NULL", fcinfo.flinfo->fn_oid);

			hashkey ^= hkey;
		}
	
	// ......省略一些非关键代码
	
	h->hash = hashkey;
}

分析:

InitFunctionCallInfoData 该宏展开为:

#define InitFunctionCallInfoData(Fcinfo, Flinfo, Nargs, Collation, Context, Resultinfo) 
	do { 
		(Fcinfo).flinfo = (Flinfo); 
		(Fcinfo).context = (Context); 
		(Fcinfo).resultinfo = (Resultinfo); 
		(Fcinfo).fncollation = (Collation); 
		(Fcinfo).isnull = false; 
		(Fcinfo).nargs = (Nargs); 
	} while (0)

这里主要是用来初始化 Fcinfo 结构体, fcinfo 类型为 FunctionCallInfoData,其定义为: typedef Datum (*PGFunction) (FunctionCallInfo fcinfo);

FunctionCallInfoData是一个通用的用于传递回调函数的入参结构体,

其中:

a、flinfo 字段是一个结构体,类型为 FmgrInfo ,该结构体里面最重要的是 fn_addr 字段,它存储了后面真正调用的 hash 回调函数的地址。

b、nargs 字段表示回调函数的入参个数,这里固定为1,说明所有的 hash 函数的入参个数都只有1个。

FunctionCallInfoData中的 arg 字段表示回调函数入参列表,这里只使用了 datum 赋值,从外层函数可以看出来,该值即为当前列的值。

所以从这里可以确定,分布键使用的 hash 回调函数的入参通过封装的 FunctionCallInfoData结构体进行传输,且最终里面使用的 hash 函数的入参只有 1 个,就是分布键的值。

FunctionCallInvoke 展开后为 ((* (fcinfo)->flinfo->fn_addr) (fcinfo)) ,即这里真正调用了 hash 回调函数,并使用前面赋值好的 fcinfo 作为参数。

最终把 hash 回调函数的返回值强转为 uint32 类型,再与之前计算出来的 hash key 做异或操作后,作为最后的 hash key 保存到当前 cdbHash 环境中的 hash 里,即最后的赋值: h->hash = hashkey

总结

外层,先对当前的会话创建一个 hash 环境,然后遍历每个分布键做一次 hash 计算,根据最终的 hash key 值,做一次 reduce,计算出 segment id。

内层,先初始化通用的回调函数入参,再调用回调函数,并与之前的 hash key 值做一次异或操作,得出当前的 hash key。

hash 回调函数分析

smallint / int / bigint 类型

smallint 类型,对应的 hash 函数是 hashint2,

int 类型,对应的 hash 函数是 hashint4,

bigint 类型,对应的 hash 函数是 hashint8,

具体实现如下:

#define PG_GETARG_DATUM(n)	 (fcinfo->arg[n])
#define PG_GETARG_INT16(n)	 DatumGetInt16(PG_GETARG_DATUM(n))
#define PG_GETARG_INT32(n)	 DatumGetInt32(PG_GETARG_DATUM(n))
#define PG_GETARG_INT64(n)	 DatumGetInt64(PG_GETARG_DATUM(n))

Datum
hashint2(PG_FUNCTION_ARGS)
{
	return hash_uint32((int32) PG_GETARG_INT16(0));
}

Datum
hashint4(PG_FUNCTION_ARGS)
{
	return hash_uint32(PG_GETARG_INT32(0));
}

Datum
hashint8(PG_FUNCTION_ARGS)
{
	
	int64		val = PG_GETARG_INT64(0);
	uint32		lohalf = (uint32) val;
	uint32		hihalf = (uint32) (val >> 32);

	lohalf ^= (val >= 0) ? hihalf : ~hihalf;

	return hash_uint32(lohalf);
}

把宏展开后,可以观察到,smallint 、int 和 bigint 实际上底层调用的 hash 函数都是 hash_uint32,唯一有区别的是 hash_uint32 的入参。

当类型是 smallint 或 int 时,入参就是其本身,而当类型是 bigint 时,该类型长度为8字节,所以需要对其处理一下:当被 hash 的值大于等于0时,则使用高4字节与第4字节异或的值进行 hash;当被 hash 的值小于0时,则使用高4字节的相反数,与低4字节异或的值进行 hash。

char / varchar / text 类型

char 类型,对应的 hash 函数是 hashbpchar,

text / varchar 类型,对应的 hash 函数是:hashtext,

具体实现如下:

typedef struct varlena text;

#define PG_GETARG_DATUM(n)	 (fcinfo->arg[n])
#define PG_DETOAST_DATUM_PACKED(datum) 
	pg_detoast_datum_packed((struct varlena *) DatumGetPointer(datum))
#define DatumGetTextPP(X)			((text *) PG_DETOAST_DATUM_PACKED(X))
#define PG_GETARG_TEXT_PP(n)		DatumGetTextPP(PG_GETARG_DATUM(n))

Datum
hashtext(PG_FUNCTION_ARGS)
{
	text	   *key = PG_GETARG_TEXT_PP(0);
	Datum		result;

	
	result = hash_any((unsigned char *) VARDATA_ANY(key),
					  VARSIZE_ANY_EXHDR(key));

	
	PG_FREE_IF_COPY(key, 0);

	return result;
}
typedef struct varlena BpChar;

#define PG_GETARG_DATUM(n)	 (fcinfo->arg[n])
#define PG_DETOAST_DATUM_PACKED(datum) 
	pg_detoast_datum_packed((struct varlena *) DatumGetPointer(datum)
#define DatumGetBpCharPP(X)			((BpChar *) PG_DETOAST_DATUM_PACKED(X))
#define PG_GETARG_BPCHAR_PP(n)		DatumGetBpCharPP(PG_GETARG_DATUM(n))

Datum
hashbpchar(PG_FUNCTION_ARGS)
{
	BpChar	   *key = PG_GETARG_BPCHAR_PP(0);
	char	   *keydata;
	int			keylen;
	Datum		result;

	keydata = VARDATA_ANY(key);
	keylen = bcTruelen(key);

	result = hash_any((unsigned char *) keydata, keylen);

	
	PG_FREE_IF_COPY(key, 0);

	return result;
}

把上面的宏展开后,对比这三种类型的 hash 函数,其实不难发现,它们的 hash 函数底层都一样,都是通过 hash_any 函数进行计算,入参都是本身字符串值,以及字符串长度。

附:所有类型对应的 hash 函数

类型 别名 函数
smallint int2 hashint2
integer "int int4"
bigint int8 hashint8
bit bithash
bit varying varbit bithash
boolean bool hashchar
bytea hashvarlena
character [(n)] char [(n)] hashbpchar
character varying [ (n) ] varchar [(n)] hashtext
text hashtext
cidr hashinet
date hashint4
inet hashinet
interval interval_hash
JSONb jsonb_hash
Macaddr hashmacaddr
numeric decimal hash_numeric
real float4 hashfloat4
time [ without time zone ] time_hash
time with time zone timetz_hash
timestamp [ without time zone ] timestamp_hash
timestamp with time zone timestamp_hash
uuid uuid_hash
您可能感兴趣的文档:

--结束END--

本文标题: greenplum分布键的hash值计算分析

本文链接: https://lsjlt.com/news/8858.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • greenplum分布键的hash值计算分析
    greenplum 数据分布策略 greenplum 是一个 MPP 架构的数据库,由一个 master 和多个 segment 组成(还可选配置一个 standby master),其数据会根据设置的分布策略分布到在不同的 segmen...
    99+
    2017-05-26
    greenplum分布键的hash值计算分析
  • 查看greenplum分布键
    1、查看greenplum分布键 select d.nspname||'.'||a.relname as table_name,string_agg(b.attname,',') as colum...
    99+
    2024-04-02
  • Greenplum怎么创建表的分布键
    本篇内容介绍了“Greenplum怎么创建表的分布键”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Gree...
    99+
    2024-04-02
  • 支持python分布式计算框架Ray的示例分析
    这篇文章将为大家详细讲解有关支持python分布式计算框架Ray的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1、简介Ray为构建分布式应用程序提供了一个简单、通用的API。Ray是一种分布式执...
    99+
    2023-06-20
  • MySQL键值的示例分析
    这篇文章将为大家详细讲解有关MySQL键值的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。 MySQL 键值概述键值类型根据数据存储要...
    99+
    2024-04-02
  • 图像相似度Hash算法的示例分析
    这篇文章主要介绍图像相似度Hash算法的示例分析,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完! 图像的相似度Hash算法 Hash算法有三种,分别为平均哈希算法(aHash)、感...
    99+
    2024-04-02
  • PHP 数组键值互换:按序键值互换的算法与性能分析
    php 数组键值互换有两种算法:简单键值互换和按序键值互换。前者通过遍历数组,将键值一一对应存储到新数组中,后者则使用 array_values() 和 array_keys() 函数按...
    99+
    2024-05-03
    php 数组
  • Java 分位点(分位值)计算方式
    目录Java 分位点(分位值)计算有一个需求那么怎么建立数学模型呢?下面用Java 代码实现正常输出完成需求核心代码Java 求百分位数说明一下java代码Java 分位点(分位值)...
    99+
    2024-04-02
  • 如何分析分布式session解决方案与一致性hash
    这篇文章将为大家详细讲解有关如何分析分布式session解决方案与一致性hash,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。一、问题的提出1. 什么是Session?用户使用网站的服务,需...
    99+
    2023-06-04
  • Java算法设计与分析分治算法
    目录一、前言二、分治算法介绍三、分治算法经典问题3.1、二分搜索3.2、快速排序3.3、归并排序(逆序数)3.4、最大子序列和3.5、最近点对四、结语一、前言 在学习分治算法之前,问...
    99+
    2024-04-02
  • Shell编程中变量数值计算的示例分析
    小编给大家分享一下Shell编程中变量数值计算的示例分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!如果要执行运算,那就少不了运算符,和其他的编程语言相似,shell也有很多的运算符如下:+、-、:代表着加号 和减号 或...
    99+
    2023-06-09
  • Java Zookeeper分布式分片算法源码分析
    这篇文章主要介绍了Java Zookeeper分布式分片算法源码分析的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Java Zookeeper分布式分片算法源码分析文章都会有所收获,下面我们...
    99+
    2023-07-05
  • Flex布局与缩放比例计算案例分析
    本篇文章为大家展示了Flex布局与缩放比例计算案例分析,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。一、Flex 布局简介Flex 是 Flexible Box 的缩写,意为"弹性布局&q...
    99+
    2023-06-08
  • Teradata支持分布式计算吗
    是的,Teradata支持分布式计算。Teradata是一种关系型数据库管理系统,具有强大的并行处理和分布式计算能力。它可以在多个节...
    99+
    2024-04-09
    Teradata
  • 分布式计算Hadoop指的是什么
    这篇文章给大家介绍分布式计算Hadoop指的是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。Hadoop是什么:Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框...
    99+
    2023-06-16
  • 实时分布式计算中的Java和NumPy有哪些关键点?
    随着互联网的快速发展,数据的规模越来越大,传统的单机计算已经无法满足大规模数据处理的需求。因此,分布式计算应运而生。实时分布式计算是一种新型的计算模式,它可以使数据处理变得更加高效、准确和快速。在实时分布式计算中,Java和NumPy是两...
    99+
    2023-10-17
    numy 分布式 实时
  • python计算分段函数值的方法
    本博文源于python科学计算,旨在解析如何使用python进行计算分段函数值。下面就以复杂的二元函数进行演示。 题目再现 求解思路 首先先生成x1,x2,然后我们将其映射到网格里...
    99+
    2024-04-02
  • Greenplum-cc-web安装配置的示例分析
    这篇文章主要为大家展示了“Greenplum-cc-web安装配置的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Greenplum-cc-web安装配置的示例分析”这篇文章吧。 进入下...
    99+
    2023-06-03
  • 分布式实时计算中如何应用Java和NumPy的数学分布算法?
    随着计算机技术的发展,分布式实时计算变得越来越重要。Java和NumPy是两种常用的语言和工具,它们有着强大的数学分布算法,可以在分布式实时计算中发挥重要作用。本文将介绍如何使用Java和NumPy的数学分布算法在分布式实时计算中进行计算...
    99+
    2023-10-17
    numy 分布式 实时
  • 分析redis集群中数据分布算法
    这篇文章主要介绍“分析redis集群中数据分布算法”,在日常操作中,相信很多人在分析redis集群中数据分布算法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”分析redis集...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作