System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于异构知识图谱的团伙挖掘方法、装置、设备及介质制造方法及图纸_技高网

基于异构知识图谱的团伙挖掘方法、装置、设备及介质制造方法及图纸

技术编号:40258285 阅读:12 留言:0更新日期:2024-02-02 22:49
本公开提供了一种基于异构知识图谱的团伙挖掘方法、装置、设备及介质,涉及人工智能技术领域。该方法包括:获取用户在多种业务场景下的实时交易数据,从实时交易数据中筛选多个人工特征,人工特征表征了用户的多个登录账户和多个登录设备的基本特征;基于多个人工特征构建知识图谱,知识图谱包括多个节点和连接不同节点的边,每个节点表征了一登录账户或登录设备,每个边表征了一登录账户与一登录设备之间的关系;基于异构图的元路径随机游走策略,对知识图谱中的各节点生成潜在特征向量;对多个潜在特征向量进行聚类计算得到多个聚类结果,将每个聚类结果对应的多个节点作为一个团伙数据,形成多个团伙数据。

【技术实现步骤摘要】

本公开涉及人工智能,具体涉及反欺诈与知识图谱挖掘领域,更具体地涉及一种基于异构知识图谱的团伙挖掘方法、装置、电子设备、介质和程序产品。


技术介绍

1、随着科技与金融的深入结合,电子银行业务规模迅速攀升,电子银行业务能够兼顾低成本、高效率等优点,深受用户青睐,各大银行争相推出新产品。然而电子银行由于无需本人到线下网点办理业务,犯罪成本低,诈骗分子常常在线上诈骗他人非法获利。

2、目前针对电子银行诈骗场景的常用解决方法主要包括以下五类:

3、(1)基于聚类的反欺诈算法:主要是利用正常用户与欺诈分子的行为数据作为数据源,对该数据进行聚类,聚类结果将行为相似的用户聚为一簇,而往往正常用户数量较多,所以一般簇中用户数量较少的一般为欺诈分子。但该方法在可解释性方面表现较差。

4、(2)基于分类的反欺诈算法:主要将数据识别分类为正常数据与欺诈数据,利用事先经过处理后的已标记数据进行训练,然后将未知数据输入训练好的模型中进行识别。该方法存在数据不均衡造成召回率低的问题。

5、(3)基于行为模式的反欺诈算法:主要分为两个步骤,第一步,将正常的用户行为作为标准正常行为模式,第二步,将未知的行为模式与标准正常行为模式进行对照,如果差异较大,则证明该行为为欺诈行为。但金融业务场景丰富,随着业务数量增加,会出现标准正常行为模式库中的特征维度过高的问题。

6、(4)基于图的反欺诈算法:通过利用实体与实体间的关系进行构图,然后从图中利用实体间的交互关系寻找出欺诈行为与欺诈实体。目前该类方法通常只支持在同类场景下进行构图,无法实现对不同场景下的实体行为分析。

7、(5)基于深度学习的反欺诈算法:主要是利用已经标注好标签的数据在例如卷积神经网络之类的深度学习模型中进行训练,该算法主要基于深度学习神经隐层的机器学习方法,隐层结果通常不可解释。


技术实现思路

1、鉴于上述问题,本公开提供了一种基于异构知识图谱的团伙挖掘方法、装置、电子设备、介质和程序产品。

2、根据本公开的第一个方面,提供了一种基于异构知识图谱的团伙挖掘方法,包括:获取用户在多种业务场景下的实时交易数据,从实时交易数据中筛选多个人工特征,人工特征表征了用户的多个登录账户和多个登录设备的基本特征;基于多个人工特征构建知识图谱,知识图谱包括多个节点和连接不同节点的边,每个节点表征了一登录账户或登录设备,每个边表征了一登录账户与一登录设备之间的关系;基于异构图的元路径随机游走策略,对知识图谱中的各节点生成潜在特征向量;对多个潜在特征向量进行聚类计算得到多个聚类结果,将每个聚类结果对应的多个节点作为一个团伙数据,形成多个团伙数据。

3、根据本公开的实施例,获取用户在多种业务场景下的实时交易数据,包括针对多种业务场景中的每种业务场景,执行以下操作:根据该业务场景制定风险规则,风险规则表征了该业务场景下可能出现的风险规则;利用bdsp批量处理程序,采集该业务场景下命中风险规则的实时交易数据;将采集到的实时交易数据生成格式化数据。

4、根据本公开的实施例,基于异构图的元路径随机游走策略,对知识图谱中的各节点生成潜在特征向量之前,还包括:将知识图谱中登录账户与登录设备的关联比例为1:1的部分进行剪枝。

5、根据本公开的实施例,基于异构图的元路径随机游走策略,对知识图谱中的各节点生成潜在特征向量,包括:根据登录账户与登录设备的关系构建异构知识图谱g=(v,e),v表示节点集合,节点集合包括账户节点和设备节点,e表示相邻两节点的边集合;事先规定元路径游走规则:游走路径中每相邻的两个节点为不同类型的节点,且元路径满足对称原则;根据元路径游走规则,对异构知识图谱中的节点进行游走选择路径,计算任一当前节点转移到多个下一候选节点中的任一候选节点的概率;根据局部概率最大化的优化目标和负采样策略,从多个下一候选节点中确定当前节点的下一目标节点,根据下一目标节点确定当前节点的潜在特征向量。

6、根据本公开的实施例,任一当前节点转移到多个下一候选节点中的任一候选节点的概率根据以下原则来计算:在当前节点的任一候选节点不符合元路径游走规则,或者当前节点与任一候选节点之间不相邻的情况下,则确定当前节点与任一候选节点的概率为0;在当前节点的任一候选节点符合元路径游走规则,且当前节点与任一候选节点之间相邻的情况下,将当前节点与任一候选节点的概率确定为所有满足此条件的下一候选节点的总数的倒数。

7、根据本公开的实施例,该方法还包括:对各团伙数据中的投诉关键词进行提取,建立各团伙数据与对应的投诉关键词之间的映射关系;根据潜在特征向量,计算知识图谱中的各关联节点之间的相似度,将相似度作为知识图谱中对应边的可信评分;综合各团伙数据的至少一个账户节点的类型、映射关系和可信评分,评估各团伙数据的风险等级。

8、根据本公开的实施例,对各团伙数据中的投诉关键词进行提取,包括:从多个团伙数据中筛选出存在投诉信息的至少一个团伙数据;针对至少一个团伙数据中的每个团伙数据,利用业务基本信息语料库对该团伙数据的投诉信息进行分词,获得多个备选关键词;利用tf-idf算法,计算每个备选关键词在该团伙数据的投诉信息中的权重;将多个权重从大到小进行排序,选择排位靠前的n个权重对应的n个备选关键词,作为该团伙数据的投诉关键词,n为正整数。

9、根据本公开的实施例,该方法还包括:将n个备选关键词更新至业务基本信息语料库,以供下一次投诉关键词的提取操作。

10、根据本公开的实施例,账户节点的类型包括普通账户和异常账户,异常账户包括投诉账户、涉案账户和冻结账户;风险等级依次包括正常交易场景、低风险、中风险和高风险。

11、根据本公开的实施例,综合各团伙数据的至少一个账户节点的类型、映射关系和可信评分,评估各团伙数据的风险等级,包括针对多个团伙数据中的任一团伙数据,执行以下操作:在该团伙数据中的所有账户节点均为普通账户,且该团伙数据所有的可信评分均大于预设阈值的情况下,确定该团伙数据属于正常交易场景;在该团伙数据中的所有账户节点均为普通账户,且该团伙数据所有的可信评分中小于预设阈值的节点个数超过预设比例的情况下,确定该团伙数据属于低风险;在该团伙数据中存在至少一个异常账户,且该团伙数据所有的可信评分中小于预设阈值的节点个数超过预设比例的情况下,确定该团伙数据属于高风险;在该团伙数据中存在至少一个异常账户,且该团伙数据所有的可信评分中小于预设阈值的节点个数不超过预设比例的情况下,确定该团伙数据属于中风险。

12、根据本公开的实施例,该方法还包括:对多个风险等级从大到小进行排序,选择排位靠前的m个风险等级对应的m个团伙数据,m为正整数;将m个团伙数据与m个团伙数据中每个团伙数据涉及的业务关键词进行展示;从知识图谱中导出m个团伙数据涉及的设备与账户信息。

13、本公开的第二方面提供了一种基于异构知识图谱的团伙挖掘装置,包括:人工特征获取模块,用于获取用户在多种业本文档来自技高网...

【技术保护点】

1.一种基于异构知识图谱的团伙挖掘方法,包括:

2.根据权利要求1所述的方法,其中,所述获取用户在多种业务场景下的实时交易数据,包括针对所述多种业务场景中的每种业务场景,执行以下操作:

3.根据权利要求1所述的方法,其中,所述基于异构图的元路径随机游走策略,对所述知识图谱中的各节点生成潜在特征向量之前,还包括:

4.根据权利要求1所述的方法,其中,所述基于异构图的元路径随机游走策略,对所述知识图谱中的各节点生成潜在特征向量,包括:

5.根据权利要求4所述的方法,其中,所述任一当前节点转移到多个下一候选节点中的任一候选节点的概率根据以下原则来计算:

6.根据权利要求1所述的方法,其中,所述方法还包括:

7.根据权利要求6所述的方法,其中,所述对各所述团伙数据中的投诉关键词进行提取,包括:

8.根据权利要求7所述的方法,其中,所述方法还包括:

9.根据权利要求6所述的方法,其中,所述账户节点的类型包括普通账户和异常账户,所述异常账户包括投诉账户、涉案账户和冻结账户;

10.根据权利要求9所述的方法,其中,所述综合各所述团伙数据的至少一个账户节点的类型、所述映射关系和所述可信评分,评估各所述团伙数据的风险等级,包括针对所述多个团伙数据中的任一团伙数据,执行以下操作:

11.根据权利要求6所述的方法,其中,所述方法还包括:

12.一种基于异构知识图谱的团伙挖掘装置,包括:

13.根据权利要求12所述的装置,其中,所述装置还包括:

14.一种电子设备,包括:

15.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~11中任一项所述的方法。

16.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~11中任一项所述的方法。

...

【技术特征摘要】

1.一种基于异构知识图谱的团伙挖掘方法,包括:

2.根据权利要求1所述的方法,其中,所述获取用户在多种业务场景下的实时交易数据,包括针对所述多种业务场景中的每种业务场景,执行以下操作:

3.根据权利要求1所述的方法,其中,所述基于异构图的元路径随机游走策略,对所述知识图谱中的各节点生成潜在特征向量之前,还包括:

4.根据权利要求1所述的方法,其中,所述基于异构图的元路径随机游走策略,对所述知识图谱中的各节点生成潜在特征向量,包括:

5.根据权利要求4所述的方法,其中,所述任一当前节点转移到多个下一候选节点中的任一候选节点的概率根据以下原则来计算:

6.根据权利要求1所述的方法,其中,所述方法还包括:

7.根据权利要求6所述的方法,其中,所述对各所述团伙数据中的投诉关键词进行提取,包括:

8.根据权利要求7所述的方法,其中,所述方法还包括:

...

【专利技术属性】
技术研发人员:廖小瑶
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1