首页 > 资讯 > 数据库 >PostgreSQL中怎么实时干预搜索排序

790

分享到

PostgreSQL中怎么实时干预搜索排序

2024-04-02 19:04:59 790人浏览安东尼

摘要

这期内容当中小编将会给大家带来有关postgresql中怎么实时干预搜索排序，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。Postgresql是一个历史悠久的数据库，最早

这期内容当中小编将会给大家带来有关postgresql中怎么实时干预搜索排序，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。

Postgresql是一个历史悠久的数据库，最早由加州大学伯克利分校的Michael Stonebraker教授领导设计，具备与oracle类似的功能、性能、架构以及稳定性。

阿里云HybridDB for PostgreSQL，提供大规模并行处理（MPP）数据仓库服务, 支持多核并行计算、向量计算、图计算、JSON,jsONB全文检索。

PostgreSQL中怎么实时干预搜索排序

3.2 系统架构

PostgreSQL高效的并行处理能力，基于JSON格式数据合并能力以及Notify实时消息能力，给我们提供了具体实现思路。因此基于上文提到业务挑战,我们梳理了相关实现方案。

PostgreSQL中怎么实时干预搜索排序

仔细分析整体方案，归纳起来涉及的方面有：

异构数据源接入
归一化服务
数据合并策略
实时分数重算

异构数据源接入

闲鱼商品相关的数据非常丰富，有各种异构数据源,如全量的离线商品数据，实时商品变更数据，各种算法维度数据等，在实现上可通过阿里云大数据平台，binlog监听工具等进行统一处理。

PostgreSQL中怎么实时干预搜索排序

如上图所示，所有异构数据源都按照统一格式，通过异步消息，输入到归一化服务，该方案的优点是不管全量数据还是增量数据都统一走消息服务，简化接入流程，同时通过消息中间层进行解耦，提高稳定性。

归一化服务

归一化服务接收上游异构数据源消息，通过数据校验模块、数据补全模块、标准格式转换模块、数据监控模块为下游输送正确的数据。

数据校验模如下图所示，数据源结合元数据中心进行字段级别的校验，如字段名称，数据类型，数据范围、默认值等，引入元数据中心最大优势是可以细粒度的控制数据源，防止脏数据、不需要的数据污染下游。

PostgreSQL中怎么实时干预搜索排序

数据补全模块数据源通常需要实时补全一些数据干预指标，如用户编辑商品，需实时分析打标是否有黄图，商品价格预测等，整个干预流程要以pipeline的形式，暴露扩展点，允许插入干预能力。

PostgreSQL中怎么实时干预搜索排序

标准格式转换模块标准格式转换模块将数据源统一按标准的格式转换成JSON结构，便于下游统一数据合并。
数据监控模块数据监控模块记录数据源的每一条数据以及异常数据记录，并将数据投递到监控系统，监控每个异构数据源异常数据，流量异常情况，第一时间发现并恢复问题。

数据合并策略

PostgreSQL中怎么实时干预搜索排序

数据合并策略主要包括基于时间戳的数据合开和数据变更通知两个先后处理流程，在数据合并流程会遇到一个核心问题，即如何快速有效的解决每个字段的冲突合并，基于时间戳统一merge。这里首先会涉及到数据存储结构，参考如下表设计结构：

create table Test (id int8 primary key,   -- 商品IDatt jsonb   -- 商品属性);

属性设计为JSON，JSON里面是K-V的属性对，如下属性结构示例，V里面是数组，包含K的值以及这对属性的最后更新时间，更新时间用于merge update，当属性发生变化时才更新，没有发生变化时，不更新。这种设计优点：

字段级别细粒度merge，保证最小集数据实时性
高扩展性，表不需要增减字段

属性结构示例

{"count": [100, "2017-01-01 10:10:00"], "price": [8880, "2018-01-04 10:10:12"], "newatt": [120, "2017-01-01 12:22:00"]}

定义完存储结构, 接下来利用PostgreSQL的JSON处理能力进行数据merge,参考如下merge udf 伪代码：

create or replace function merge_json(jsonb, jsonb) returns jsonb as $$
  select jsonb_object_agg(key,value) from (
  select 
    coalesce(a.key, b.key) as key, 
    case 
    when 
    coalesce(jsonb_array_element(a.value,1)::text::timestamp, '1970-01-01'::timestamp) 
    > 
    coalesce(jsonb_array_element(b.value,1)::text::timestamp, '1970-01-01'::timestamp) 
    then a.value
    else b.value
    end
  from jsonb_each($1) a full outer join jsonb_each($2) b using (key)
  ) t;
$$ language sql strict ;

定义完merge方法后，我们在数据源有数据变更时直接调用。

insert into a values
(1, '{"price":[1000, "2019-01-01 10:10:12"], "newatt": ["hello", "2018-01-01"]}')
on conflict (id)
do update set
att = merge_json(a.att, excluded.att) 
where
a.att <> merge_json(a.att, excluded.att);

从上面可以看出当商品ID出现冲突时，会调用merge_json 进行数据合并，至此数据合并流程完成,接下来需要将合并结果实时通知下游，可以利用PostgreSQL的触发品和Notify机制来处理。

触发器设计

//触发器要执行的udf
CREATE OR REPLACE FUNCTION notify1() returns trigger AS $function$
declare  
begin
     perfORM pg_notify(  
       'a',    -- 异步消息通道名字  
       format('CLASS:notify, ID:%s, ATT:%s', NEW.id, NEW.att)   -- 消息内容  
     );  
  return null;  
end
$function$ language plpgsql strict;
//创建触发器
create trigger tg1 after insert or update on Test for each row execute procedure notify1();

可以看出当数据插入或更新会触发trigger 执行nofity1 函数创建异步nofity消息，并向指定的通道发送通知,下游应用可通过jdbc监听相应的通道，接收消息，进行后续实时打分流程，参考如下伪代码：

this.pGConn = conn.unwrap(org.postgresql.PGConnection.class);
Statement stmt = conn.createStatement();
stmt.execute("LISTEN a");
stmt.close();

org.postgresql.PGNotification notifications[] = pgconn.getNotifications();
if (notifications != null) {
    for (int i=0; i < notifications.length; i++) {
        System.out.println("Got notification: " + notifications[i].getName());
    }
}

另外PostgreSQL并发处理性能非常高效，绑定触发器后会增加PostgreSQL的数据写入时长，但是压测结果来看，依然能够满足我们的业务写入性能要求，

以1000万数据测试结果为例：

PostgreSQL中怎么实时干预搜索排序

数据实时打分干预搜索

PostgreSQL中怎么实时干预搜索排序

服务层在监听到Notify消息，解析消息数据，通过规则引擎对各指标权重进行分数重算，计算综合分数，打到搜索tag表，搜索引擎实时监测tag表，将综合分数dump到搜索引擎，实时干扰排序结果。

上述就是小编为大家分享的PostgreSQL中怎么实时干预搜索排序了，如果刚好有类似的疑惑，不妨参照上述分析进行理解。如果想知道更多相关知识，欢迎关注编程网数据库频道。

您可能感兴趣的文档:

--结束END--

本文标题: PostgreSQL中怎么实时干预搜索排序

本文链接: https://lsjlt.com/news/58766.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

PostgreSQL中怎么实时干预搜索排序

3.2 系统架构

异构数据源接入

归一化服务

数据合并策略

PostgreSQL中怎么实时干预搜索排序

vue怎么实现搜索筛选、降序排序数据

PostgreSQL中怎么实现全文搜索功能

怎么使用JS排序和搜索算法

怎么在python中实现顺序搜索

C#中怎么利用正则表达式实现预搜索

微信小程序怎么实现搜索输入框带搜索记录

vue怎么实现实时搜索显示功能

Android项目类似淘宝电商搜索功能，监听软键盘搜索事件，延迟自动搜索，以及时间排序的搜索历史记录的实现

C++怎么实现在旋转有序数组中搜索

微信小程序中的搜索功能怎么实现

MyBatis怎么实现按时间排序

怎么用Vue+java实现时间段的搜索

MySQL中怎么实现模糊搜索

JavaScript中怎么实现全文搜索

PHP中怎么实现搜索数组

List<T>搜索和排序中的方法有什么不不同

微信小程序中怎么实现一个搜索框组件

MyBatis Plus分页时怎么实现排序

Android中怎么实现poi搜索功能

关于SQL建表语句使用详解

HBase在大数据审计与合规性追踪中的应用

MySQL与HBase在大数据金融分析中的性能与可扩展性对比

HBase的Region Server之间的网络通信优化

HBase在大数据监控与告警系统中的实时数据处理能力

MySQL与HBase在大数据安全策略中的实现与对比

HBase的分布式事务处理在复杂业务场景中的应用

MySQL与HBase在混合存储架构中的整合策略

HBase如何支持高效的二级索引查询

MySQL与HBase在物联网数据收集与处理中的协作模式