System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书一个或多个实施例涉及知识图谱领域,尤其涉及一种生成带有频次约束的图规则的方法及装置。
技术介绍
1、风险控制,简称风控,是许多服务平台面临的问题。风控是通过对各类风险进行评估和管理,以确保服务平台的运行和/或用户资产安全的一系列措施和方法。随着互联网的发展,风控的范围也在不断增加,其中,一个重要的方向是在电子支付/电子交易平台对潜在的风险用户/风险交易进行识别,并采取相应的风控措施。
2、由于知识图谱中的知识具有十分直观的可解释性,目前有一些方案基于领域相关知识图谱进行推理,得到风控的规则,以发现潜在的风险。然而,这些方案普遍存在正确率低,置信度差的问题。因此,需要一种更好的方法,基于知识图谱生成更加可靠的图规则,更好地挖掘出风险判断规则。
技术实现思路
1、本说明书一个或多个实施例描述了一种生成带有频次约束的图规则的方法及装置,旨在为规则图中的节点和边添加频次约束,以增加整体规则图的置信度。
2、第一方面,提供了一种生成带有频次约束的图规则的方法,包括:
3、从预先形成的与交易相关的知识图谱中采样出多个目标子图,任一目标子图的头节点和尾节点所代表的用户和/或交易之间具有特定的风险关系;
4、对任一目标子图进行泛化处理,得到节点和/或边数量少于该目标子图的目标泛化图,所述泛化处理包括,对部分节点和边进行合并操作,所述目标泛化图包括基于所述合并操作确定的各个节点和边的出现频次;
5、确定多个目标泛化图的最大共同子图,
6、在一种可能的实施方式中,从预先形成的与交易相关的知识图谱中采样出多个目标子图,包括:
7、从所述知识图谱中采样出具有所述风险关系的多个目标节点对;
8、对于任一目标节点对,其包含目标头节点和目标尾节点,从所述知识图谱中确定出多条从所述目标头节点到目标尾节点的目标路径;
9、基于所述多条目标路径的并集,确定所述目标节点对所对应的目标子图。
10、在一种可能的实施方式中,对任一目标子图进行泛化处理,得到节点和/或边数量少于该目标子图的目标泛化图,包括:
11、根据目标子图中任一节点分别到所述目标子图的头节点和尾节点的距离的组合,确定该节点的距离编码;
12、根据任一节点的距离编码和节点类型,确定该节点的编码结果;根据任一边的边类型及该边所连接的头尾节点的编码结果,确定该边的编码结果;
13、根据所述目标子图中节点和边的编码结果,对所述目标子图中的各个节点和边进行合并操作,得到目标泛化图。
14、在一种可能的实施方式中,根据所述目标子图中节点和边的编码结果,对所述目标子图中的各个节点和边进行合并操作,包括:
15、将所述目标子图中编码结果相同的节点进行合并,得到合并节点;
16、将所述目标子图中编码结果相同的边进行合并,得到合并边。
17、在一种可能的实施方式中,所述目标泛化图包括第一合并节点和第一合并边,所述第一合并节点由所述目标子图中第一数目个原始节点合并得到,所述第一合并节点的频次为第一数目;所述第一合并边由所述目标子图中第二数目条原始边合并得到,所述第一合并边的频次为第二数目。
18、在一种可能的实施方式中,所述最大共同子图的头节点和尾节点所代表的用户和/或交易之间具有所述风险关系。
19、在一种可能的实施方式中,所述性能评价指标包括置信度和/或覆盖度;基于预设的性能评价指标,确定所述最大共同子图中各个节点和边的频次约束,包括:
20、将所述各个目标泛化图中对应于所述最大共同子图的部分作为正样本,添加到样本集中;
21、从所述知识图谱中确定多个负样本,添加到所述样本集中,任一负样本的头尾节点之间不具有所述风险关系;
22、基于所述样本集,确定所述最大共同子图的各个节点和边的频次变化分别与置信度和/或覆盖度的目标对应关系;
23、基于预设的置信度阈值和/或覆盖度阈值与所述目标对应关系,确定所述各个节点和边的频次约束。
24、在一种可能的实施方式中,从所述知识图谱中确定多个负样本,包括:
25、从所述知识图谱中确定出不具有所述风险关系的多个节点对,任一节点对与具有所述风险关系连接的头尾节点分别具有相同的节点类型;
26、基于任一节点对,从所述知识图谱中确定出以所述节点对为头尾节点的子图,将所述子图进行泛化处理后,基于泛化处理结果确定负样本。
27、在一种可能的实施方式中,确定所述最大共同子图的各个节点和边的频次变化分别与置信度和/或覆盖度的目标对应关系,包括:
28、使用高维正态分布分别拟合所述节点和边的频次变化与置信度和/或覆盖度的目标对应关系;或者,
29、使用机器学习模型分别拟合所述节点和边的频次变化与置信度和/或覆盖度的目标对应关系。
30、在一种可能的实施方式中,所述频次约束包括:最小值约束、最大值约束、区间约束。
31、第二方面,提供了一种链接预测的方法,使用根据第一方面的方法生成的规则图,预测待预测节点对所代表的用户和/或交易之间是否具有特定的风险关系,包括:
32、从包含所述待预测节点对的知识图谱中采样出以所述待预测节点对为头尾节点的第一子图;
33、对所述第一子图进行泛化处理,得到其对应的第一泛化图;所述泛化处理包括,对部分节点和边进行合并操作,所述第一泛化图包括基于所述合并操作确定的各个节点和边的出现频次;
34、将所述第一泛化图与所述规则图进行匹配处理,得到二者是否匹配的匹配结果,所述匹配处理包括对所述出现频次的匹配;所述匹配结果用于确定所述待预测节点对是否具有所述风险关系。
35、在一种可能的实施方式中,将所述第一泛化图与所述规则图进行匹配处理,得到二者是否匹配的匹配结果,包括:
36、将所述第一泛化图中各个节点和边的频次分别与所述规则图中对应的频次约束进行匹配,如果全部匹配通过,则所述匹配结果为真;如果存在没有匹配通过的结果,则所述匹配结果为假。
37、第三方面,提供了一种生成带有频次约束的图规则的装置,包括:
38、采样单元,配置为,从预先形成的与交易相关的知识图谱中采样出多个目标子图,任一目标子图的头节点和尾节点所代表的用户和/或交易之间具有特定的风险关系;
39、泛化处理单元,配置为,对任一目标子图进行泛化处理,得到节点和/或边数量少于该目标子图的目标泛化图,所述泛化处理包括,对部分节点和边进行合并操作,所述目标泛化图包括基于所述合并操作确定的各个节点和边的出现频次;
40、规则图生成单元,配置为,确定多个目标泛化图的最大本文档来自技高网...
【技术保护点】
1.一种生成带有频次约束的图规则的方法,包括:
2.根据权利要求1所述的方法,从预先形成的与交易相关的知识图谱中采样出多个目标子图,包括:
3.根据权利要求1所述的方法,对任一目标子图进行泛化处理,得到节点和/或边数量少于该目标子图的目标泛化图,包括:
4.根据权利要求3所述的方法,根据所述目标子图中节点和边的编码结果,对所述目标子图中的各个节点和边进行合并操作,包括:
5.根据权利要求1所述的方法,其中,所述目标泛化图包括第一合并节点和第一合并边,所述第一合并节点由所述目标子图中第一数目个原始节点合并得到,所述第一合并节点的频次为第一数目;所述第一合并边由所述目标子图中第二数目条原始边合并得到,所述第一合并边的频次为第二数目。
6.根据权利要求1所述的方法,其中,所述最大共同子图的头节点和尾节点所代表的用户和/或交易之间具有所述风险关系。
7.根据权利要求1所述的方法,其中,所述性能评价指标包括置信度和/或覆盖度;基于预设的性能评价指标,确定所述最大共同子图中各个节点和边的频次约束,包括:
8.
9.根据权利要求7所述的方法,其中,确定所述最大共同子图的各个节点和边的频次变化分别与置信度和/或覆盖度的目标对应关系,包括:
10.根据权利要求7所述的方法,其中,所述频次约束包括:最小值约束、最大值约束、区间约束。
11.一种链接预测的方法,使用如权利要求1所述的方法生成的规则图,预测待预测节点对所代表的用户和/或交易之间是否具有特定的风险关系,包括:
12.根据权利要求11所述的方法,将所述第一泛化图与所述规则图进行匹配处理,得到二者是否匹配的匹配结果,包括:
13.一种生成带有频次约束的图规则的装置,包括:
14.一种链接预测的装置,使用如权利要求1所述的装置生成的规则图,预测待预测节点对所代表的用户和/或交易之间是否具有特定的风险关系,包括:
15.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-12中任一项所述的方法。
16.一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-12中任一项所述的方法。
...【技术特征摘要】
1.一种生成带有频次约束的图规则的方法,包括:
2.根据权利要求1所述的方法,从预先形成的与交易相关的知识图谱中采样出多个目标子图,包括:
3.根据权利要求1所述的方法,对任一目标子图进行泛化处理,得到节点和/或边数量少于该目标子图的目标泛化图,包括:
4.根据权利要求3所述的方法,根据所述目标子图中节点和边的编码结果,对所述目标子图中的各个节点和边进行合并操作,包括:
5.根据权利要求1所述的方法,其中,所述目标泛化图包括第一合并节点和第一合并边,所述第一合并节点由所述目标子图中第一数目个原始节点合并得到,所述第一合并节点的频次为第一数目;所述第一合并边由所述目标子图中第二数目条原始边合并得到,所述第一合并边的频次为第二数目。
6.根据权利要求1所述的方法,其中,所述最大共同子图的头节点和尾节点所代表的用户和/或交易之间具有所述风险关系。
7.根据权利要求1所述的方法,其中,所述性能评价指标包括置信度和/或覆盖度;基于预设的性能评价指标,确定所述最大共同子图中各个节点和边的频次约束,包括:
8.根据权利要求7所述的方法,其中,从所述知识图谱中确定多个负样...
【专利技术属性】
技术研发人员:胡彬,赵登,何建杉,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。