一种用于客户身份识别的知识图谱构建方法和系统技术方案

技术编号:37120279 阅读:13 留言:0更新日期:2023-04-01 05:15
本发明专利技术提供了一种用于客户身份识别的知识图谱构建方法和系统,属于数据处理技术领域,包括如下步骤:从目标客户的银行数仓的原生数据中采集目标客户的关联数据,基于关联数据计算第一实体的风险标签,基于风险标签筛选三元组信息并构建关联知识图谱;从目标客户的交易流水表中采集目标客户的资金交易数据;基于所述资金交易数据生成客户资金网络群组数据,基于所述客户资金网络群组数据和网络模型生成可疑资金交易知识图谱;将所述关系知识图谱和所述交易知识图谱叠加,形成客户身份识别知识图谱,向用户更直观展示目标客户的关联关系和交易关系,不仅提高了用户的判断效率,还提高图分析及处理效率,降低系统各类资源占用。用。用。

【技术实现步骤摘要】
一种用于客户身份识别的知识图谱构建方法和系统


[0001]本申请涉及数据处理
,具体涉及一种用于客户身份识别的知识图谱构建方法和系统。

技术介绍

[0002]金融行业对存量客户(所服务的客户)的潜在风险的管理是一件重要的日常工作,无论是从监管角度还是金融行业内控角度。因此从反洗钱、反欺诈到黑名单核查等,监管不断强调对存量客户进行客户身份识别(KYC)的重要性。
[0003]现有技术中,采用了人工智能手段来帮助用户对存量客户进行客户身份识别,与通过人工调查的手段相比,不仅提高了效率,而且调查方向也比通过人工的调查方向更多,更全面。但是,目前采用的人工智能手段调查方向多导致数据维度多,都只是客观的展示了客户多维度的信息,并没有从客户的这些信息中通过匹配风险标签模型的方式,提炼出客户的风险标签信息;识别客户交易时未能通过网络模型有效识别出有风险的交易,未能将交易中涉及的客户关系和风险信息直观展示,可能需要多个界面查询实现,这样导致调查数据不直观,降低了用户的判断效率。

技术实现思路

[0004](一)申请目的
[0005]有鉴于此,本申请的目的在于提供一种用于客户身份识别的知识图谱构建方法和系统,用于解决现有技术中采用的人工智能手段调查方向多导致数据维度多,包含了不需要的内容,导致调查数据不直观,降低了用户的判断效率的技术问题。
[0006](二)技术方案
[0007]本申请公开了一种用于客户身份识别的知识图谱构建方法,包括如下步骤:S1、从目标客户的银行数仓的原生数据中采集目标客户的关联数据,基于关联数据提取三元组信息,所述三元组信息包块第一实体、第一属性和第一关系,所述关联数据包括基础业务数据和衍生数据;基于关联数据计算第一实体的风险标签,基于风险标签筛选三元组信息并构建关联知识图谱;
[0008]S2、从目标客户的基础业务数据中采集目标客户的资金交易数据,所述资金交易数据包括我方客户、对手客户、交易渠道、交易方式、交易金额和交易时间;基于所述资金交易数据生成客户资金网络群组数据,基于所述客户资金网络群组数据和识别异常交易行为的网络模型生成可疑资金交易知识图谱;其中,可疑资金交易知识图谱包括第三实体和第三关系,其中,第三实体包括交易发生的我方客户和对手客户,第三关系包括资金量和资金流向;
[0009]S3、将所述关系知识图谱和所述交易知识图谱叠加,形成客户身份识别知识图谱。
[0010]在一种可能的实施方式中,所述分析实体包括:本行对公客户、他行对公客户、本行对私客户和他行对私客户中的一个或多个,所述辅助实体包括受益人、法人、股东和有关
联关系的客户;所述第一属性包括:客户名称、证件类型、证件号码、地址、电话、性别、年龄、国籍、组织机构代码、客户经理名和电子邮件;所述第一关系包括:受益人关系、股东关系、法定代表人关系、亲属关系、同事关系和实际控制人关系。
[0011]在一种可能的实施方式中,所述基于关联数据计算第一实体的风险标签,基于风险标签筛选三元组信息并构建关联知识图谱包括:
[0012]S11、基于基础业务数据和衍生数据计算第一实体的风险特征,基于风险特征匹配风险标签并将匹配的所述风险标签赋予第一实体;
[0013]S12、基于风险标签筛选第一实体获取第二实体,所述第二实体为所述第一实体中被赋予风险标签的实体;
[0014]S13、基于第二实体、第一属性和第一关系构建关联知识图谱。
[0015]在一种可能的实施方式中,所述基于基础业务数据计算第一实体的风险特征,基于风险特征匹配风险标签并将匹配的所述风险标签赋予第一实体包括:S111、通过预置的多个风险特征匹配风险特征组,所述风险特征组包括至少一个风险特征;
[0016]S112、基于风险特征组和内置风险模型匹配风险标签,将匹配的所述风险标签赋予第一实体。
[0017]在一种可能的实施方式中,所述基于所述资金交易数据生成客户资金网络群组数据,基于所述客户资金网络群组数据通过网络模型生成可疑资金交易知识图谱包括:
[0018]S21、对交易双方的资金收付关系进行组网计算,生成客户资金网络群组数据网,其中客户作为客户资金网络群组数据网中的点,而客户之间的资金往来做为客户作为客户资金网络群组数据网中的边;
[0019]S22、基于客户资金网络群组数据,利用内置资金网络指标进行计算,计算出资金网络特征;
[0020]S23、基于资金网络特征,利用内置网络特征模型进行计算生成可疑资金交易知识图谱。
[0021]作为本申请的第二方面,还提供了一种用于客户身份识别的知识图谱构建系统,包括:关联知识图谱构建模块、可疑资金交易知识图谱构建模块和客户身份识别知识图谱构建模块;其中,所述关联知识图谱构建模块用于从目标客户的银行数仓的原生数据中采集目标客户的关联数据,基于关联数据提取三元组信息,所述三元组信息包块第一实体、第一属性和第一关系,所述关联数据包括基础业务数据和衍生数据;基于关联数据计算第一实体的风险标签,基于风险标签筛选三元组信息并构建关联知识图谱;所述可疑资金交易知识图谱构建模块用于从目标客户的基础业务数据中采集目标客户的资金交易数据,所述资金交易数据包括我方客户、对手客户、交易渠道、交易方式、交易金额和交易时间;基于所述资金交易数据生成客户资金网络群组数据,基于所述客户资金网络群组数据和识别异常交易行为的网络模型生成可疑资金交易知识图谱;其中,可疑资金交易知识图谱包括第三实体和第三关系,其中,第三实体包括交易发生的我方客户和对手客户,第三关系包括资金量和资金流向;所述客户身份识别知识图谱构建模块用于将所述关系知识图谱和所述交易知识图谱叠加,形成客户身份识别知识图谱。
[0022]在一种可能的实施方式中,所述第一实体包括分析实体和辅助实体,所述分析实体包括:本行对公客户、他行对公客户、本行对私客户和他行对私客户中的一个或多个,所
述辅助实体包括受益人、法人、股东和有关联关系的客户;所述第一属性包括:客户名称、证件类型、证件号码、地址、电话、性别、年龄、国籍、组织机构代码、客户经理名和电子邮件;所述第一关系包括:受益人关系、股东关系、法定代表人关系、亲属关系、同事关系和实际控制人关系。
[0023]在一种可能的实施方式中,所述关联知识图谱构建模块包括风险标签匹配单元、实体筛选单元和关联知识图谱构建单元;其中,风险标签匹配单元用于基于基础业务数据和衍生数据计算第一实体的风险特征,基于风险特征匹配风险标签并将匹配的所述风险标签赋予第一实体;所述实体筛选单元用于基于风险标签筛选第一实体获取第二实体,所述第二实体为所述第一实体中被赋予风险标签的实体;所述关联知识图谱构建单元用于基于第二实体、第一属性和第一关系构建关联知识图谱。
[0024]在一种可能的实施方式中,所述风险标签匹配单元包括第一子单元和第二子单元,其中第一子单元用于通过预置的多个风险特征匹配风险特征组,所述风险特征组包括至少一个风险特征;所述第二子单本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于客户身份识别的知识图谱构建方法,其特征在于,S1、从目标客户的银行数仓的原生数据中采集目标客户的关联数据,基于关联数据提取三元组信息,所述三元组信息包块第一实体、第一属性和第一关系,所述关联数据包括基础业务数据和衍生数据;基于关联数据计算第一实体的风险标签,基于风险标签筛选三元组信息并构建关联知识图谱;S2、从目标客户的基础业务数据中采集目标客户的资金交易数据,所述资金交易数据包括我方客户、对手客户、交易渠道、交易方式、交易金额和交易时间;基于所述资金交易数据生成客户资金网络群组数据,基于所述客户资金网络群组数据和识别异常交易行为的网络模型生成可疑资金交易知识图谱;其中,可疑资金交易知识图谱包括第三实体和第三关系,其中,第三实体包括交易发生的我方客户和对手客户,第三关系包括资金量和资金流向;S3、将所述关系知识图谱和所述交易知识图谱叠加,形成客户身份识别知识图谱。2.根据权利要求1所述的一种用于客户身份识别的知识图谱构建方法,其特征在于,所述第一实体包括分析实体和辅助实体,所述分析实体包括:本行对公客户、他行对公客户、本行对私客户和他行对私客户中的一个或多个,所述辅助实体包括受益人、法人、股东和有关联关系的客户;所述第一属性包括:客户名称、证件类型、证件号码、地址、电话、性别、年龄、国籍、组织机构代码、客户经理名和电子邮件;所述第一关系包括:受益人关系、股东关系、法定代表人关系、亲属关系、同事关系和实际控制人关系。3.根据权利要求2所述的一种用于客户身份识别的知识图谱构建方法,其特征在于,所述基于关联数据计算第一实体的风险标签,基于风险标签筛选三元组信息并构建关联知识图谱包括:S11、基于基础业务数据和衍生数据计算第一实体的风险特征,基于风险特征匹配风险标签并将匹配的所述风险标签赋予第一实体;S12、基于风险标签筛选第一实体获取第二实体,所述第二实体为所述第一实体中被赋予风险标签的实体;S13、基于第二实体、第一属性和第一关系构建关联知识图谱。4.根据权利要求3所述的一种用于客户身份识别的知识图谱构建方法,其特征在于,所述基于基础业务数据计算第一实体的风险特征,基于风险特征匹配风险标签并将匹配的所述风险标签赋予第一实体包括:S111、通过预置的多个风险特征匹配的风险特征组,所述风险特征组包括至少一个风险特征;S112、基于风险特征组和内置风险模型匹配风险标签,将匹配的所述风险标签赋予第一实体。5.根据权利要求4所述的一种用于客户身份识别的知识图谱构建方法,其特征在于,所述基于所述资金交易数据生成客户资金网络群组数据,基于所述客户资金网络群组数据通过网络模型生成可疑资金交易知识图谱包括:S21、对交易双方的资金收付关系进行组网计算,生成客户资金网络群组数据网,其中客户作为客户资金网络群组数据网中的点,而客户之间的资金往来作为客户资金网络群组数据网中的边;
S22、基于客户资金网络群组数据,利用内置资金网络指标进行计算,计算出资金网络特征;S23、基于资金网络特征,利用内置网络特征模型进行计算生成可疑资金交易知识图谱。6.一种用于客户身份识别的知识图谱构建系统,其特征在于,包括:关联知识图谱构建模块、可疑资金交易知识图谱构建模块和客户身份识别知识图谱...

【专利技术属性】
技术研发人员:丁珂胡佰庆高建新梁春雨闫庆
申请(专利权)人:北京领雁科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1