一种预审核方法和装置制造方法及图纸

技术编号:33150150 阅读:15 留言:0更新日期:2022-04-22 14:03
本申请涉及一种预审核方法和装置。涉及金融风控领域。所述方法包括:以待处理数据为基础,获取待处理超图;遍历所述待处理超图中的连通子超图,根据已标记节点,计算所述待处理超图中所有未标记节点的期望值;对所述待处理超图内所有未标记节点按所述期望值进行排序,获得第一类待审核用户;遍历所述待处理超图中的超边,进行逐一评估,获得第二类待审核用户;将所述第一类待审核用户和所述第二类待审核用户合并为待审核用户。采用本方法能够挖掘得到潜在的、具有某一共同特征的团伙成员,以供审核。审核。审核。

【技术实现步骤摘要】
一种预审核方法和装置


[0001]本专利技术涉及金融风控领域,特别涉及一种预审核方法和装置。

技术介绍

[0002]当今社会,互联网技术高度发达,大量传统商业行为都被成功移植到线上,为人们的日常生活带来便利。与此同时,利用新技术进行的违法犯罪行,却给社会经济发展和人民合法权益带来更严重的危害。幸得网络技术能在一定程度上,能够通过用户的行为痕迹,合理推测用户的人群类别,为机构对潜在的威胁行为进行风险预警或者当个人普通用户面对某些嫌疑用户时做出标识提供技术上的保障。
[0003]在实际操作层面,有时需要根据具有某一显著特征的重点用户探查与之联系紧密的用户群体,推断群体性质,以供进一步审查、核实。目前,存在诸如MarkNewman的modularity maximization算法,Neo4j中的Louvain算法等,可以根据用户关系图得到内部联系比较紧密的社区。尽管这些算法可以用来探测图上的社区,但是对这些社区的计算识别需要大量的计算资源。例如:在modularity maximization算法中,为了将图做社区切割,需要计算一个大型稀疏矩阵的最大特征值,为了实现这个算法,需要耗费大量的计算资源。
[0004]超图是计算机科学中的一种数据结构,是对图的一种拓展,特别适合描述现实世界中人与人之间的交互关系。超图由节点和超边组成,每条超边上可以存在两个以上节点,同时,超边中的节点还可以被赋予权重。每条超边可以被认为是一个团伙。相比较图来说,超图包含了更加丰富的信息,可以被充分应用于识别具有某一特征的群体(团伙),例如:欺诈团伙。在超图中,由于结构的特殊性,天然存在前文所述的社区概念,采用超图算法可以有效降低计算资源的占用。

技术实现思路

[0005]为了解决现有技术的问题,本专利技术实施例提供了一种预审核方法和装置,以克服现有技术在使用用户关系图探测图上社区时,耗费大量计算资源的问题。为了解决上述的一个或多个技术问题,本专利技术采用的技术方案如下:
[0006]第一方面,提供一种预审核方法,包括:
[0007]以待处理数据为基础,获取待处理超图,其中,待处理超图包括至少1个连通子超图,连通子超图包括多个节点,节点与待处理数据中的用户一一对应,节点包括已标记节点和未标记节点;
[0008]遍历待处理超图中的连通子超图,根据已标记节点,计算待处理超图中所有未标记节点的期望值,其中,已标记节点代表被标记为预设标签的用户,期望值代表未标记节点与已标记节点之间关系的紧密程度;
[0009]对待处理超图内所有未标记节点按期望值进行排序,获得第一类待审核用户;
[0010]遍历待处理超图中的超边,进行逐一评估,获得第二类待审核用户;
[0011]将第一类待审核用户和第二类待审核用户合并为待审核用户。
[0012]进一步地,以待处理数据为基础,获取待处理超图包括:
[0013]以待处理数据为基础,根据预设特征构建超图;
[0014]若预设特征数量为1,则根据预设特征构建特征超图,并将特征超图作为预处理超图;
[0015]若预设特征数量大于1,则分别根据预设特征构建与预设特征相对应的特征超图,将所有特征超图合并作为预处理超图;
[0016]若预处理超图包括至少两个连通子超图,则遍历连通子超图,判断连通子超图中是否包含已标记节点,得到待处理超图,包括:
[0017]若不包含已标记节点,则删除当前的连通子超图;
[0018]若包含已标记节点,则保留连通图子超图。
[0019]进一步地,将所有特征超图合并作为预处理超图包括:
[0020]将含有同类型超边的特征超图进行合并;
[0021]和/或,
[0022]将含有异类型超边的特征超图进行合并,得到预处理超图。
[0023]进一步地,遍历待处理超图中的连通子超图,根据已标记节点,计算待处理超图中所有未标记节点的期望值包括:
[0024]使用受阻随机游走算法,计算从已标记节点到已标记节点的相邻节点的转移概率,其中,相邻节点是与已标记节点同属于一个连通子超图的所有未标记节点;
[0025]根据转移概率构建节点转移矩阵;
[0026]根据节点转移矩阵求解所有未标记节点的期望值。
[0027]进一步地,使用受阻随机游走算法,计算从已标记节点到已标记节点的相邻节点的转移概率包括:
[0028]计算从已标记节点跳转到任意相邻节点的发出概率;
[0029]计算任意相邻节点接收跳转的接收概率;
[0030]已标记节点到任意相邻节点的转移概率,为发出概率与任意相邻节点对应的接收概率的乘积。
[0031]进一步地,对待处理超图内所有未标记节点按期望值进行排序,获得第一类待审核用户包括:
[0032]将所有未标记节点按期望值的降序排列,得到期望值列表;
[0033]将期望值列表中,预设位数内的节点所代表的用户标记为待审核用户。
[0034]进一步地,遍历待处理超图中的超边,进行逐一评估,获得第二类待审核用户包括:
[0035]遍历待处理超图中的超边,计算超边中已标记节点的数量占超边的节点总数的比例;
[0036]将比例与预设比例阈值进行比较;
[0037]若比例大于预设比例阈值,则将超边中未标记节点所代表的用户标记为第二类待审核用户。
[0038]进一步地,一种预审核方法还包括:
[0039]将待审核用户的资料送入审核模型进行审核;
[0040]将符合预设标签标准的待审核用户标记预设标签,作为新增标签用户;
[0041]将新增标签用户输入至标签库;
[0042]统计新增标签用户数量,若新增标签用户数量小于预设新增阈值,则完成方法;
[0043]若新增标签用户数量大于预设新增阈值,则更新待处理超图中的节点标签,重新遍历待处理超图中的超边,进行逐一评估,获得第二类待审核用户开始执行。
[0044]进一步地,以待处理数据为基础,获取待处理超图前还包括:
[0045]寻找待处理数据中的孤立节点,并删除孤立节点以及孤立节点对应的用户数据以获得待处理数据;
[0046]和/或,
[0047]进一步按预设时间区间,在系统数据中提取预设时间区间内的数据,作为待处理数据。
[0048]第二方面,一种预审核装置包括:待处理超图获取模块,期望值计算模块,期望值排序模块,社区发现模块,合并模块;
[0049]待处理超图获取模块,用于以待处理数据为基础,获取待处理超图,其中,待处理超图包括至少1个连通子超图,连通子超图包括多个节点,节点与待处理数据中的用户一一对应,节点包括已标记节点和未标记节点;
[0050]期望值计算模块,用于遍历待处理超图中的连通子超图,根据已标记节点,计算待处理超图中所有未标记节点的期望值,其中,已标记节点代表被标记为预设标签的用户,期望值代表未标记节点与已标记节点之间关系的紧密本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预审核方法,其特征在于,所述方法包括:以待处理数据为基础,获取待处理超图,其中,所述待处理超图包括至少1个连通子超图,所述连通子超图包括多个节点,所述节点与所述待处理数据中的用户一一对应,所述节点包括已标记节点和未标记节点;遍历所述待处理超图中的连通子超图,根据已标记节点,计算所述待处理超图中所有未标记节点的期望值,其中,所述已标记节点代表被标记为预设标签的用户,所述期望值代表所述未标记节点与所述已标记节点之间关系的紧密程度;对所述待处理超图内所有未标记节点按所述期望值进行排序,获得第一类待审核用户;遍历所述待处理超图中的超边,进行逐一评估,获得第二类待审核用户;将所述第一类待审核用户和所述第二类待审核用户合并为待审核用户。2.根据权利要求1所述的一种预审核方法,其特征在于,所述以待处理数据为基础,获取待处理超图包括:以所述待处理数据为基础,根据预设特征构建超图;若所述预设特征数量为1,则根据所述预设特征构建特征超图,并将所述特征超图作为预处理超图;若所述预设特征数量大于1,则分别根据所述预设特征构建与所述预设特征相对应的特征超图,将所有特征超图合并作为预处理超图;若所述预处理超图包括至少两个连通子超图,则遍历所述连通子超图,判断所述连通子超图中是否包含已标记节点,得到所述待处理超图,包括:若不包含已标记节点,则删除当前的连通子超图;若包含已标记节点,则保留所述连通图子超图。3.根据权利要求2所述的一种预审核方法,其特征在于,所述将所有特征超图合并作为预处理超图包括:将含有同类型超边的特征超图进行合并;和/或,将含有异类型超边的特征超图进行合并,得到所述预处理超图。4.根据权利要求1所述的一种预审核方法,其特征在于,所述遍历所述待处理超图中的连通子超图,根据已标记节点,计算所述待处理超图中所有未标记节点的期望值包括:使用受阻随机游走算法,计算从所述已标记节点到所述已标记节点的相邻节点的转移概率,其中,所述相邻节点是与所述已标记节点同属于一个连通子超图的所有未标记节点;根据所述转移概率构建节点转移矩阵;根据所述节点转移矩阵求解所有未标记节点的期望值。5.根据权利要求4所述的一种预审核方法,其特征在于,所述使用受阻随机游走算法,计算从所述已标记节点到所述已标记节点的相邻节点的转移概率包括:计算从所述已标记节点跳转到任意所述相邻节点的发出概率;计算任意所述相邻节点接收跳转的接收概率;所述已标记节点到任意相邻节点的转移概率,为所述发出概率与任意所述相邻节点对应的所述接收概率的乘积。
6.根据权利要求1所述的...

【专利技术属性】
技术研发人员:郑清正李恩志
申请(专利权)人:南京星云数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1