返回顶部
首页 > 资讯 > 精选 >Nebula Graph怎么解决风控业务
  • 335
分享到

Nebula Graph怎么解决风控业务

2023-06-29 18:06:52 335人浏览 独家记忆
摘要

这篇“Nebula Graph怎么解决风控业务”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Nebula 

这篇“Nebula Graph怎么解决风控业务”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Nebula Graph怎么解决风控业务”文章吧。

业务背景

有别于传统银行的信贷业务十天、半个月的申请审核时长,互联网金融借贷第一个特点便是申请审核非常快,可能用户上一秒刚在手机端提交授信申请,下一秒系统便会返回授信申请的结果。此外,互联网金融借贷还有一个特点:数据信息的真实性难以保证,用户填写的信息:年收入、家庭关系、联系人都会存在信息不实的情况。而这两个互联网金融的特点催生了一个产业,就是网络黑产。通俗来说,网络黑产就是用户薅“借贷”羊毛的行为。因为网络借贷隐匿性强,一旦黑产账号实施了欺诈行为后,通过互联网很难追踪到特定的人。此外,由于借贷审批时效性的关系,黑产账号能很方便地做到走量、薅到更多的钱。基于此,催生互联网金融的风控需求,需要系统甄别欺诈场景。

那如何甄别网络黑产呢?通过用户与不同实体、设备、GPS 与手机号之间的关联关系,以及社群发现查看社群中的个体是否有欺诈风险、进行反欺诈的个案调查,能很好地进行借贷风控。目前,众安保险的风控是基于 Nebula Graph 实现的。

为什么选择 Nebula Graph

Nebula Graph怎么解决风控业务

在众安保险技术选型之初,团队成员调研过图数据库市场的产品,首先筛选出了 JanusGraph、OrientDB。

先来说下 JanusGraph,在众安金融事业技术团队内部 JanusGraph 有一大优势:团队成员对它熟悉,不少工程师使用过 JanusGraph,这从某种程度上降低了图数据库开发、上手成本。使用过 JanusGraph 的研发都知道它是一个分布式图数据库,存储、索引依赖开源组件,例如:HBase(存储)、elasticsearch(索引)。而之前公司的某个业务线曾使用过 JanusGraph,底层搭载线上 HBase 存储服务,而该业务相对独立和其他核心业务不存在强依赖关系。“不同的国家有不同的国情,一旦相同机制硬搬到不同的国家,可能会出现水土不服问题”,目前众安保险风控业务的基础数据存储在 HBase 中,假如风控系统使用 JanusGraph 的话,将上百亿图数据完全导入 HBase 会对 HBase 集群产生影响、增加查询毛刺,导致其他业务线受到影响。此外,在大规模写入速度性能方面,JanusGraph 导入较慢。综合上述原因,即便 JanusGraph 具有低上手成本,但其强依赖其他组件、导入性能差,所以 JanusGraph pass。

在图数据库产品调研过程中,我们发现 OrientDB 在 DB-Engine 排名较前、功能完善。经过性能测试,发现在小规模数据集下使用 OrientDB 体感良好,但一旦 Mock 数据过亿,大规模数据集下使用 OrientDB 会遇到 Server 端频繁报错问题。查阅 OrientDB 官方文档无果之后,众安保险向 OrientDB 官方 GitHub 仓提交了 issue。但是 OrientDB 反馈响应慢,在提交 issue 的过程中,我们还发现大规模数据集 Server 端频繁报错问题社区用户两年前提交过,issue 仍未解决处于 open 状态。此外,在大规模数据写入性能方面,写入点的速度尚可接受,但写入边的 QPS 只有 1-2k,用这个速度开始图数据建模的话耗时将在天级别,这是不可接受的。综上,虽然 OrientDB 排名靠前、功能完善,但大规模数据频繁 Server 报错、社区 issue 响应慢、大规模写入速度不佳导致最后我们没有选择 OrientDB。

而 Nebula Graph 参与技术选型的契机是,在众安保险开始图数据库选型时,咨询其他公司(京东、携程…)从业人员公司所用图数据库时,他们一致推荐 Nebula Graph。因此,Nebula Graph 成为众安保险图数据库选型的选项之一。而在实际测试中,我们发现 Nebula Graph 大规模写入速度非常快,生产环境测试数据能达到 10w+ QPS。此外,Nebula Graph 存储和索引依赖于本地 RocksDB 库,不依赖于其他大数据组件,符合业务需求。在大数据生态支持方面,Nebula Graph 支持主流的 spark(nebula-spark-connector)和 flink(nebula-flink-connector)。在社区响应和反馈时效上,Nebula Graph 也给了我们比较好的体验。

这里额外讲下社区支持,在整个图数据库调研过程中,我们发现相较于成熟的诸如 MySQLoracle 此类的 sql 数据库,图数据库发展时间较短,由此产生的问题是遇到部分图数据库产品问题,搜索引擎能提供的信息较少。像之前 OrientDB 的频繁报错问题,如果社区未能提供及时的技术反馈,对于使用者来说他可能要花费大量时间来阅读源码去 Debug,人力成本便会急剧上升、性价比极低。

而 Nebula Graph 在社区支持跟反馈方面给了众安保险非常良好的体验。作为他们的客户,包括在最早期的 1.0,众安保险给 Nebula Graph 提交了不少使用问题和 bug,Nebula 研发同学都能及时回复和 fix bug。到 2.0 部署时,我们遇到生产部署问题他们也能及时提供技术支持。这一点相比于其他的图数据库厂商,是非常值得推荐的。这也是我们选择 Nebula Graph 作为图数据库来支撑众安保险业务的根本性原因。

金融风控业务实践

下图为众安保险基于 Nebula Graph 的风控系统架构图,它集数据处理、加工清洗、计算、图服务应用为一体。

Nebula Graph怎么解决风控业务

如上图所示,最底层为业务库,不同的业务关系数据存在不同的业务库中,包括用户附件、设备、 GPS、IP 等等信息。

再上层,是由离线数仓和实时数仓构成的图数据库加工清洗层,离线数仓通过 DataX 进行每天 T+1 的数据回流,回流业务库的数据存到 ODPS 中,Nebula Graph 通过 Spark 来读取当中数据并写入到数据库中。在实时数仓方面,通过众安保险内部的监听组件 BLCS 将数据写到 kafka,再经过 FlinkSQL 搭建的实时数仓进行数据清洗加工,最后通过 Flink 实时地写入到 Nebula Graph 中。为了保证数据的一致性,实时数仓每天进行数据校验,如果数据存在不一致,则会使用离线数据补齐缺失的数据。

数据清洗加工层上面则是存储 & 计算层,存储层不用说自然是 Nebula Graph。而计算方面,通过 Nebula Graph 提供的 Spark Connector 组件,将图数据库中的数据读取到 Spark 平台通过 GraphX 执行预测模型,最后将结果写回 Nebula Graph 中。

最后,通过众安保险的微服务系统将图数据库存储 & 计算对接给上层图应用,提供图探索服务、风控特征、个案调查、预测模型等图服务。

关系图谱

Nebula Graph怎么解决风控业务

这里简单讲解众安保险内部的图社群探索的关系图谱,通过上图的关系图谱讲解具象化地介绍众安是如何利用图数据库甄别欺诈场景,如何使用图数据库实践风控特性。

上图有 2 类节点:

  • 人(蓝色节点)

  • 手机(绿色节点)

存在 3 类关系:

  • 人-[申请]->手机

  • 手机-[联系人]->人

  • 人-[绑卡]->手机

第一眼看到上面的图,很明显看到 2 个稠密热点,热点手机号被五、六十填为他的家庭联系人的手机号。按常识来说,当代中国大多独生子女家庭,加上旁系关系,也很难出现五、六十个人同时将同一个手机号填为他的家庭联系人的手机号。所以,这个手机号关联人可能是欺诈团伙分子,黑产团伙可能知晓借贷评分系统中有一环节是对家庭联系人的手机号进行信用评分,团伙希望通过关联高信用分的手机号从而提高信用分。

基于上述特征,我们可以查询用户所在社群的规模、用户是否在疑似欺诈社群中对他进行一个初步风控判断。这里讲述下,即便某个用户处于异常关系网络中也不代表他是个欺诈用户,处于异常社群是个判断用户是否为欺诈分子的充分不必要条件。因为存在一种可能,用户本身并非是欺诈分子,但直系亲戚参与了中介代办、团伙欺诈,此时便会出现正常用户和异常用户都存在同一关系网络的情况。

下一步,我们需要深入挖掘用户和异常中心的“亲密”离散度,探寻它们的路径距离。通过结合 Nebula Graph 本身的路径查找功能,分析离散度(靠近异常点,还是处于社群边缘)从而判断某位用户是否是有欺诈嫌疑。

这里以手机号为例,来帮助大家理解众安是如何通过 Nebula 来识别用户的欺诈场景的。其实众安保险内部还有设备、IP 等等关系图谱,这里不展开赘述。

图模型预测

Nebula Graph怎么解决风控业务

这部分来介绍下图预测模型,

Connected Component(贷前)

Label Propagation(贷中)

Degree Statistical

刚上面部分介绍的关系图谱是通过联通分量(Connected Component)算法计算得出的,主要应用在贷前的用户授信申请环节。

再来是标签传播(Label Propagation),不同于联通分量,标签传播更多地应用于贷中环节。标签传播主要是通过一个确定的点 Y 去传播、衍生出它相关点。举个例子,贷中用户名单中某个用户是严重逾期人员,这个人员便是打上逾期标签的确定点 Y,结合既定的风控规则查看点 Y 关联延伸的点中哪些点出现相似逾期行为,从而判断这些点是否属于严重逾期的社群。这便是贷中的标签传播算法。

最后一个算法是 Degree Statistical,全图关系度数,主要供风控人员使用。风控人员在做风控特征时,可能会提出几十、上百个图特征,基于这些特征数据需要用历史的数据去验证,查看哪些特征可以真正地识别出欺诈用户或是严重逾期用户。而这个验证过程,如果使用传统数仓通过 ODPS 做深度查询的话,无论在执行效率、耗时,还是在 SQL 代码编写方面,都是一个非常低效的过程。但,通过 Nebula Graph 将点数据读取到 GraphX 中进行全图关系度计算,将 7 度或者是 10 度关系以行的形式写回到 ODPS 中,提供给风控人员使用,可以帮助他们更快地完成风控规则制定、完成风控任务。

未来展望

版本规划

在主题分享时,众安保险所用的 Nebula 版本为 2.0.1,后续 Nebula v2.5.0 中新增水位线 watermark 功能去防止查询遇到稠密热点占用内存过高拖垮 storage 进程的情况。众安保险这边会在测试环境部署 v2.5.0 版本进行验证,验证通过之后,业务线逐步切到 v2.5.0 版本中。

更多应用场景

后续 Nebula 可能应用在数仓的表与字段的血缘依赖、调度平台任务关系的管理中,众安保险基础平台部的同学正在动手用 Nebula Graph 去替换已有的传统实现方案。

以上就是关于“Nebula Graph怎么解决风控业务”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注编程网精选频道。

--结束END--

本文标题: Nebula Graph怎么解决风控业务

本文链接: https://lsjlt.com/news/326136.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Nebula Graph怎么解决风控业务
    这篇“Nebula Graph怎么解决风控业务”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Nebula ...
    99+
    2023-06-29
  • Nebula Graph解决风控业务实践
    目录业务背景为什么选择 Nebula Graph金融风控业务实践关系图谱图模型预测未来展望版本规划更多应用场景互联网金融的借贷同传统信贷业务有所区别,相较于传统信贷业务,互联网金融具...
    99+
    2024-04-02
  • 亚马逊云服务器风控怎么解决
    对买家号进行关联:通过购买同一个IP地址的账户,然后在一个新的网站上使用该IP地址购买商品。这样,该账户就会被认为是同一个人或同一个IP地址的账户。 对卖家号进行关联:通过向同一卖家购买商品的客户发送相同的电子邮件地址,然后使用相同的卖家...
    99+
    2023-10-27
    亚马逊 服务器
  • 亚马逊云服务器风控怎么解除
    1. 了解亚马逊云服务器风控 在使用亚马逊云服务器时,如果您的账户出现异常行为,可能会被亚马逊云服务器风控系统检测到并暂停服务。这是为了保护亚马逊云服务器的安全和稳定性,防止恶意攻击和滥用。 2. 解除亚马逊云服务器风控的方法 如果您的亚...
    99+
    2023-10-27
    亚马逊 服务器
  • 业务监控管理解决方案
    第 1 章 方案背景1.1. 方案背景随着网络与自动化的建设,各个企业信息化程度已经达到了较高水平。信息技术在提高管理水平,促进业务创新,提升企业竞争力方面发挥着日益重要的作用。显而易见,基本上所有的业务系统都架设在网络之上以提供服务。然...
    99+
    2023-06-04
  • 亚马逊云服务器风控解决方案
    1. 了解亚马逊云服务器风控 在使用亚马逊云服务器时,可能会遇到风控问题。亚马逊云服务器的风控是指亚马逊云服务器系统检测到异常活动或者恶意行为时,会采取一系列措施来保护服务器和用户的安全。这些措施包括限制访问、暂停服务、封禁账户等。 2....
    99+
    2023-10-27
    亚马逊 解决方案 服务器
  • win11麦克风失灵怎么解决
    这篇文章主要讲解了“win11麦克风失灵怎么解决”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“win11麦克风失灵怎么解决”吧!win11麦克风没声音解决方法:右键点击声音图标,打开“声音设...
    99+
    2023-06-30
  • win10麦克风没声音怎么解决
    这篇文章主要介绍“win10麦克风没声音怎么解决”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“win10麦克风没声音怎么解决”文章能帮助大家解决问题。win10麦克风没声音解决方法右键一下我的电脑,...
    99+
    2023-07-01
  • win11麦克风不能用怎么解决
    这篇文章主要介绍了win11麦克风不能用怎么解决的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇win11麦克风不能用怎么解决文章都会有所收获,下面我们一起来看看吧。win11麦克风不能用解决方法:方法一: 首先...
    99+
    2023-06-30
  • 电脑风扇声音大怎么解决
    这篇文章主要介绍了电脑风扇声音大怎么解决的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇电脑风扇声音大怎么解决文章都会有所收获,下面我们一起来看看吧。电脑风扇声音大原因:机箱中排线布局不合理,电脑风扇在转动的时候...
    99+
    2023-07-02
  • win11麦克风声音很小怎么解决
    如果您在Windows 11上的麦克风声音很小,可以尝试以下几种解决方法:1. 调整麦克风音量:右键单击任务栏上的音量图标,选择“声...
    99+
    2023-09-08
    win11
  • win11锁屏风景画没了怎么解决
    如果在Windows 11中锁屏时没有显示风景画,可以尝试以下解决方法:1. 检查锁屏设置:打开Windows 11的设置应用程序,...
    99+
    2023-09-07
    win11
  • 电脑麦克风没声音怎么解决
    这篇文章主要介绍了电脑麦克风没声音怎么解决的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇电脑麦克风没声音怎么解决文章都会有所收获,下面我们一起来看看吧。电脑麦克风没声音的解决方法方法一: 我们打开“控制面板”→...
    99+
    2023-07-01
  • Win10麦克风没有声音怎么解决
    今天小编给大家分享一下Win10麦克风没有声音怎么解决的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。Win10麦克风没有声音...
    99+
    2023-07-01
  • Win10麦克风无法录音怎么解决
    这篇文章主要讲解了“Win10麦克风无法录音怎么解决”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Win10麦克风无法录音怎么解决”吧!Win10麦克风无法录音解决方法第一种方法 首先我们检...
    99+
    2023-07-01
  • windows10电脑麦克风没声音怎么解决
    这篇“windows10电脑麦克风没声音怎么解决”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“windows10电脑麦克风没...
    99+
    2023-07-01
  • 电脑显卡风扇声很大怎么解决
    电脑显卡风扇声很大的原因可能有以下几种:1. 显卡过热:检查显卡散热器是否被灰尘堵塞,如果有,可以使用吹气罐或者小刷子清理灰尘。2....
    99+
    2023-08-09
    电脑
  • 报表检测出 sql 植入风险怎么解决
    报表检测到 sql 植入风险,一般是报表工具提供了通用查询的功能,也就意味着 sql(sql 类数据集)是可以通过参数动态拼接的。如 where 子句: Select … from T where ${w} ...
    99+
    2021-08-02
    报表检测出 sql 植入风险怎么解决
  • 电脑风扇突然噪音很大怎么解决
    电脑风扇突然噪音很大可能是由于灰尘或机械故障引起的。以下是一些常见的解决方法:1. 清洁风扇:首先,关闭电脑并拔掉电源插头。然后,使...
    99+
    2023-09-05
    电脑
  • Win10系统麦克风声音太小怎么解决
    本文小编为大家详细介绍“Win10系统麦克风声音太小怎么解决”,内容详细,步骤清晰,细节处理妥当,希望这篇“Win10系统麦克风声音太小怎么解决”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。Win10系统麦克风声...
    99+
    2023-07-01
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作