首页 > 资讯 > 后端开发 > 其他教程 >PostgreSQL将数据加载到buffer cache中操作方法

769

分享到

PostgreSQL将数据加载到buffer cache中操作方法

2024-04-02 19:04:59 769人浏览泡泡鱼

摘要

我们都知道数据在缓存中访问远比在磁盘中访问速度要快，那么我们怎么在pg中将指定的数据加载到缓存中呢，这有点类似于oracle的in-memory。当然要注意并不是把数据加载到内存中

我们都知道数据在缓存中访问远比在磁盘中访问速度要快，那么我们怎么在pg中将指定的数据加载到缓存中呢，这有点类似于oracle的in-memory。

当然要注意并不是把数据加载到内存中就一定是好的，因为相较于磁盘，内存总是有限的，所以一帮我们只是在特殊场合下将需要的数据加载到内存中来加快访问的速度。

我们可以使用pg_prewarm插件来将指定的表加载到OS Buffer或者pg shared buffer中。

安装：


bill=# create extension pg_prewarm ;
CREATE EXTENSION

性能测试：

构建测试表t1，t2，分别插入1000W条测试数据


bill=# create table t1(id int,info text);
CREATE TABLE
bill=# create table t2(id int,info text);
CREATE TABLE
bill=# insert into t1 select generate_series(1,10000000),md5(random()::text);
INSERT 0 10000000
bill=# insert into t2 select generate_series(1,10000000),md5(random()::text);
INSERT 0 10000000

测试前先清空shared_buffer，可以使用下面sql查看shared_buffer使用情况：
安装pg_buffercache插件：


bill=# create extension pg_buffercache;
CREATE EXTENSION

查询shared_buffer使用情况：


SELECT
    c.relname,
    count(*) AS buffers
FROM pg_buffercache b
INNER JOIN pg_class c
   ON b.relfilenode = pg_relation_filenode(c.oid)
    AND b.reldatabase IN (0, (SELECT oid FROM pg_database
WHERE datname = current_database()))
GROUP BY c.relname
ORDER BY 2 DESC;
                 relname                 | buffers
-----------------------------------------+---------
 pg_attribute                            |      36
 pg_proc                                 |      27
 pg_class                                |      15
 pg_operator                             |      14
 pg_depend_reference_index               |      13
 pg_depend                               |      11
 pg_attribute_relid_attnum_index         |      10
 pg_proc_proname_args_nsp_index          |       9
......

可以看到t1和t2表均不在shared_buffer中，我们来手动将t2表加载到shared_buffer中。


bill=# SELECT pg_prewarm('t2');
 pg_prewarm
------------
      83334
(1 row)

性能测试：

可以看到全表扫描t2表的性能要提升不少。


bill=# explain analyze select * from t1;
                                                    QUERY PLAN
------------------------------------------------------------------------------------------------------------------
 Seq Scan on t1  (cost=0.00..183334.80 rows=10000080 width=37) (actual time=0.060..772.902 rows=10000000 loops=1)
 Planning Time: 0.294 ms
 Execution Time: 1044.922 ms
(3 rows)

Time: 1045.722 ms (00:01.046)

bill=# explain analyze select * from t2;
                                                    QUERY PLAN
------------------------------------------------------------------------------------------------------------------
 Seq Scan on t2  (cost=0.00..183334.80 rows=10000080 width=37) (actual time=0.012..519.691 rows=10000000 loops=1)
 Planning Time: 0.280 ms
 Execution Time: 790.607 ms
(3 rows)

Time: 791.314 ms

pg_prewarm其它介绍：

下面主要介绍下pg_prewarm函数：
该函式的创建语句如下：


CREATE FUNCTION pg_prewarm(reGClass,
mode text default buffer,
fork text default main,
first_block int8 default null,
last_block int8 default null)
RETURNS int8
AS MODULE_PATHNAME, pg_prewarm
LANGUAGE C

参数如下：

regclass：要做prewarm的表名
mode：prewarm模式。prefetch表示异步预取到os cache；read表示同步预取；buffer表示同步读入PG的shared buffer
fork：relation fork的类型。一般用main，其他类型有visibilitymap和fsm
first_block & last_block：开始和结束块号。表的first_block=0，last_block可通过pg_class的relpages字段获得
RETURNS int8：函数返回pg_prewarm处理的block数目（整型）

可能有人会想：我直接将表select *全表查询一遍不就可以将数据加载到缓存中了嘛，为什么还需要使用pg_prewarm呢？因为对于大小超过shared_buffer/4的表进行全表扫描时，pg一般不会使用全部的shared_buffer，而是只使用很少一部分的shared_buffer。所以，将大表加载到缓存中不能用一个查询来直接实现的，而pg_prewarm正好可以满足这个需求。

参考链接：

https://www.postgresql.org/docs/13/pgprewarm.html
Https://www.postgresql.org/docs/13/pgbuffercache.html

到此这篇关于PostgreSQL将数据加载到buffer cache中的文章就介绍到这了,更多相关PostgreSQL数据加载buffer cache内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

--结束END--

本文标题: PostgreSQL将数据加载到buffer cache中操作方法

本文链接: https://lsjlt.com/news/123660.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

PostgreSQL将数据加载到buffer cache中操作方法

安装：

性能测试：

性能测试：

pg_prewarm其它介绍：

参考链接：

PostgreSQL将数据加载到buffer cache中操作方法

如何将数据从SQL Server 迁移到PostgreSQL？将数据从SQL Server 迁移到PostgreSQL方法分析！

将Win10文件添加到白名单中的操作方法

GO将mysql 中 decimal 数据类型映射到 protobuf的操作方法

GO将mysql 中 decimal 数据类型映射到 protobuf的操作方法

如何使用Java函数load将数据加载到数组中？

phpmyadmin数据表加字段的操作方法

Android SQLite数据库加密的操作方法

使用 goavro 创建的 Avro 文件将数值数据加载到 BigQuery 中

怎么用Java客户端将数据加载到Grakn知识图中

php中将json数据存储到mysql的方法

JavaScript中将元素添加到数组开头的方法

django中操作mysql数据库的方法

数组操作：如何在Java中实现快速大数据加载？

阿里云函数计算到数据库的操作方法

PostgreSQL数据库事务插入删除及更新操作的方法

Go 语言中如何实现异步数据加载和数组操作？

PDO中操作大数据对象的方法

C#中通过反射将枚举元素加载到ComboBo的实现方法

windows中将收藏夹里的下载链接加入到开始的方法

c语言怎么计算字符串长度

c++排序函数sort怎么使用

C++中beginthreadex线程启动不了怎么解决

c语言swap函数如何调用

c++中使用swap函数报错怎么解决

c++中decltype的用法是什么

c语言中sizeof语句怎么使用

C语言怎么实现对文件夹加密

c语言怎么将小数转换成整数

C++中coledatetime函数的用法是什么