异常交易账户群体识别方法及装置制造方法及图纸

技术编号:25952802 阅读:12 留言:0更新日期:2020-10-17 03:45
本申请实施例提供一种异常交易账户群体识别方法及装置,方法包括:将各个账户的属性信息分别输入用于预测账户风险的机器学习模型,并将至少一个账户确定为高风险账户;针对每个高风险账户分别执行局部社区挖掘步骤:以当前的高风险账户作为发起节点,在图数据中分别确定其他各个节点与该发起节点之间的关联值,并确定高风险账户对应的风险账户社区;若获取到多个风险账户社区,且各个风险账户社区之间均满足预设的非相似要求,则将各个风险账户社区分别确定为目标金融机构的异常交易账户群体。本申请能够有效提高异常交易账户群体识别的效率、可靠性及准确性,进而能够提高识别得到异常交易账户群体的金融机构的运转安全性及可靠性。

【技术实现步骤摘要】
异常交易账户群体识别方法及装置
本申请涉及数据处理
,具体涉及异常交易账户群体识别方法及装置。
技术介绍
异常金融活动对金融机构和地区安全等已经构成了越来越严重的威胁。尽管反异常金融工作已经受到了各方的高度关注,针对异常金融手段的复杂、多变,多以群体账户的形式存在且群体内账户转账频繁的实际情况,如何有效地检测异常金融活动仍然是一个巨大挑战。当前,绝大多数反异常金融活动的方法通常为基于规则或者基于账户的特征信息建立识别模型。一方面,基于规则的异常金融账户识别方法虽然能够帮助发现一些异常的交易行为,但规则大多是根据历史数据总结出来的,过于依赖人工经验,难免疏漏。而且犯罪分子也多多少少掌握了一些反异常金融活动的规则,故意地去规避检测,因此基于规则的异常金融账户识别方式难以达到大规模、高效识别的要求。另一方面,基于账户的特征信息建立机器学习或者人工神经网络识别模型,如GDBT和全连接神经网络模型,虽然大大提高了异常金融账户的识别准确率,但是,当前的异常金融活动往往涉及到群体犯罪。现有的反异常金融模型只利用了账户的特征信息作为训练样本,只适用于识别单个账户的异常金融行为,不能识别出群体中隐蔽的而又与群体中其他账户联系密切的账户,而往往这些账户是资金的最后接收账户。近年来,随着电子通信技术、社会媒体技术等新技术的快速发展,社区发现算法吸引了国内外众多学者的关注。社区是指,在图数据中,社区内节点链接紧密,而与社区外节点链接稀疏的节点集合。社区发现是指,把图中的节点划分成内部连接紧密、与外部链接稀疏的节点集合。以群体账户的形式发生的异常金融行为,群体内账户转账频繁,而与群体外账户转账较少,符合社区的定义。社区发现分为局部挖掘和全图挖掘,如,尽管有很多社区发现的算法,但是无法直接应用于群体式异常金融交易账户的识别。第一,银行的账户数目巨大,并不适用于计算量大的全图社区发现算法,会导致因计算量过大而造成的识别效率低的问题;第二,局部社区发现算法,相较于全图挖掘算法,尽管计算量少,但对于社区发现的发起节点没有明确的选择,或者选择的节点不符合群体式进行异常金融行为的业务解释,则会影响异常金融行为识别的准确性。也就是说,现有的异常交易账户社区识别方法无法同时满足识别效率及识别准确性的要求。
技术实现思路
针对现有技术中的问题,本申请提供一种异常交易账户群体识别方法及装置,能够有效提高异常交易账户群体识别的效率、可靠性及准确性,进而能够提高识别得到异常交易账户群体的金融机构的运转安全性及可靠性。为解决上述技术问题,本申请提供以下技术方案:第一方面,本申请提供一种异常交易账户群体识别方法,包括:将目标金融机构对应的各个账户的属性信息分别输入用于预测账户风险的机器学习模型,并根据该机器学习模型的输出将至少一个账户确定为高风险账户;针对每个所述高风险账户分别执行局部社区挖掘步骤,其中,所述局部社区挖掘步骤包括:以当前的高风险账户作为发起节点,在包含有该发起节点的图数据中分别确定其他各个节点与该发起节点之间的关联值,并根据各个所述节点与该发起节点之间的关联值以及预设的密切关联判定规则,确定当前的高风险账户对应的风险账户社区;若经所述局部社区挖掘步骤获取多个所述风险账户社区,且各个所述风险账户社区之间均满足预设的非相似要求,则将各个所述风险账户社区分别确定为所述目标金融机构的异常交易账户群体。进一步地,所述将目标金融机构对应的各个账户的属性信息分别输入用于预测账户风险的机器学习模型,并根据该机器学习模型的输出将至少一个账户确定为高风险账户,包括:将目标金融机构对应的各个账户的属性信息分别输入LightGBM模型中,并根据该LightGBM模型的输出将至少一个账户确定为高风险账户;其中,所述LightGBM模型为基于属性信息训练集预先训练得到的,该属性信息训练集包含有多个历史账户的属性信息以及各个所述历史账户对应的标签,该标签用于表示对应的历史账户是否为高风险账户。进一步地,在所述将目标金融机构对应的各个账户的属性信息分别输入用于预测账户风险的机器学习模型,并根据该机器学习模型的输出将至少一个账户确定为高风险账户之前,还包括:获取预设时间段内的目标金融机构的各个账户的属性信息以及用于构建图数据的交易信息;其中,所述属性信息包括属性特征信息和交易特征信息,所述交易信息包括账户之间的转账记录信息。进一步地,在所述针对每个所述高风险账户分别执行局部社区挖掘步骤之前,还包括:应用各个账户的交易信息构建用于反映各个所述账户之间关联关系的图数据,其中,所述图数据中的各个节点分别与各个所述账户一一对应,且所述图数据中的边用于表示相邻的两个所述节点之间的交易信息。进一步地,所述以当前的高风险账户作为发起节点,在包含有该发起节点的图数据中分别确定其他各个节点与该发起节点之间的关联值,并根据各个所述节点与该发起节点之间的关联值以及预设的密切关联判定规则,确定当前的高风险账户对应的风险账户社区,包括:以当前的高风险账户作为发起节点,在包含有该发起节点的图数据中分别确定其他各个节点与该发起节点之间的关联值;在图数据中的除所述发起节点以外的其他各个节点中,筛选得到内部关联关系满足预设的密切关联判定规则的节点,并根据内部关联关系满足预设的密切关联判定规则的节点和所述发起节点生成当前的高风险账户对应的风险账户社区。进一步地,所述以当前的高风险账户作为发起节点,在包含有该发起节点的图数据中分别确定其他各个节点与该发起节点之间的关联值,包括:以当前的高风险账户作为发起节点,对包含有该发起节点的图数据进行近似page-rank计算,得到所述图数据中除所述发起节点外的其他各个节点的page-rank值,其中,所述page-rank值用于表示对应节点与所述发起节点之间的关联程度。进一步地,所述在图数据中的除所述发起节点以外的其他各个节点中,筛选得到内部关联关系满足预设的密切关联判定规则的节点,并根据内部关联关系满足预设的密切关联判定规则的节点和所述发起节点生成当前的高风险账户对应的风险账户社区,包括:按照从大到小的顺序对各个节点各自与所述发起节点之间的关联值进行排序,得到由排序后的各个节点组成的序列,以及,将所述发起节点作为初始的账户社区;导率获取步骤:提取当前所述序列中的首个节点,将当前提取的节点加入所述账户社区中,并获取所述账户社区当前的导率值;判断所述账户社区当前的导率值是否连续预设次数下降,若是,则将当前账户社区中的除所述发起节点之外的节点均确定为内部关联关系满足预设的密切关联判定规则的节点;若否,则返回执行所述导率获取步骤;应用内部关联关系满足预设的密切关联判定规则的节点和所述发起节点组成当前的高风险账户对应的风险账户社区。进一步地,还包括:若经所述局部社区挖掘步骤获取多个所述风险账户社区,且各个所述风险账户社区之间不满足预设的非相似要求,则对存在相似关系的所述风险账户社区进行合本文档来自技高网
...

【技术保护点】
1.一种异常交易账户群体识别方法,其特征在于,包括:/n将目标金融机构对应的各个账户的属性信息分别输入用于预测账户风险的机器学习模型,并根据该机器学习模型的输出将至少一个账户确定为高风险账户;/n针对每个所述高风险账户分别执行局部社区挖掘步骤,其中,所述局部社区挖掘步骤包括:以当前的高风险账户作为发起节点,在包含有该发起节点的图数据中分别确定其他各个节点与该发起节点之间的关联值,并根据各个所述节点与该发起节点之间的关联值以及预设的密切关联判定规则,确定当前的高风险账户对应的风险账户社区;/n若经所述局部社区挖掘步骤获取多个所述风险账户社区,且各个所述风险账户社区之间均满足预设的非相似要求,则将各个所述风险账户社区分别确定为所述目标金融机构的异常交易账户群体。/n

【技术特征摘要】
1.一种异常交易账户群体识别方法,其特征在于,包括:
将目标金融机构对应的各个账户的属性信息分别输入用于预测账户风险的机器学习模型,并根据该机器学习模型的输出将至少一个账户确定为高风险账户;
针对每个所述高风险账户分别执行局部社区挖掘步骤,其中,所述局部社区挖掘步骤包括:以当前的高风险账户作为发起节点,在包含有该发起节点的图数据中分别确定其他各个节点与该发起节点之间的关联值,并根据各个所述节点与该发起节点之间的关联值以及预设的密切关联判定规则,确定当前的高风险账户对应的风险账户社区;
若经所述局部社区挖掘步骤获取多个所述风险账户社区,且各个所述风险账户社区之间均满足预设的非相似要求,则将各个所述风险账户社区分别确定为所述目标金融机构的异常交易账户群体。


2.根据权利要求1所述的异常交易账户群体识别方法,其特征在于,所述将目标金融机构对应的各个账户的属性信息分别输入用于预测账户风险的机器学习模型,并根据该机器学习模型的输出将至少一个账户确定为高风险账户,包括:
将目标金融机构对应的各个账户的属性信息分别输入LightGBM模型中,并根据该LightGBM模型的输出将至少一个账户确定为高风险账户;
其中,所述LightGBM模型为基于属性信息训练集预先训练得到的,该属性信息训练集包含有多个历史账户的属性信息以及各个所述历史账户对应的标签,该标签用于表示对应的历史账户是否为高风险账户。


3.根据权利要求1所述的异常交易账户群体识别方法,其特征在于,在所述将目标金融机构对应的各个账户的属性信息分别输入用于预测账户风险的机器学习模型,并根据该机器学习模型的输出将至少一个账户确定为高风险账户之前,还包括:
获取预设时间段内的目标金融机构的各个账户的属性信息以及用于构建图数据的交易信息;
其中,所述属性信息包括属性特征信息和交易特征信息,所述交易信息包括账户之间的转账记录信息。


4.根据权利要求3所述的异常交易账户群体识别方法,其特征在于,在所述针对每个所述高风险账户分别执行局部社区挖掘步骤之前,还包括:
应用各个账户的交易信息构建用于反映各个所述账户之间关联关系的图数据,其中,所述图数据中的各个节点分别与各个所述账户一一对应,且所述图数据中的边用于表示相邻的两个所述节点之间的交易信息。


5.根据权利要求1所述的异常交易账户群体识别方法,其特征在于,所述以当前的高风险账户作为发起节点,在包含有该发起节点的图数据中分别确定其他各个节点与该发起节点之间的关联值,并根据各个所述节点与该发起节点之间的关联值以及预设的密切关联判定规则,确定当前的高风险账户对应的风险账户社区,包括:
以当前的高风险账户作为发起节点,在包含有该发起节点的图数据中分别确定其他各个节点与该发起节点之间的关联值;
在图数据中的除所述发起节点以外的其他各个节点中,筛选得到内部关联关系满足预设的密切关联判定规则的节点,并根据内部关联关系满足预设的密切关联判定规则的节点和所述发起节点生成当前的高风险账户对应的风险账户社区。


6.根据权利要求5所述的异常交易账户群体识别方法,其特征在于,所述以当前的高风险账户作为发起节点,在包含有该发起节点的图数据中分别确定其他各个节点与该发起节点之间的关联值,包括:
以当前的高风险账户作为发起节点,对包含有该发起节点的图数据进行近似page-rank计算,得到所述图数据中除所述发起节点外的其他各个节点的page-rank值,其中,所述page-rank值用于表示对应节点与所述发起节点之间的关联程度。


7.根据权利要求5所述的异常交易账户群体识别方法,其特征在于,所述在图数据中的除所述发起节点以外的其他各个节点中,筛选得到内部关联关系满足预设的密切关联判定规则的节点,并根据内部关联关系满足预设的密切关联判定规则的节点和所述发起节点生成当前的高风险账户对应的风险账户社区,包括:
按照从大到小的顺序对各个节点各自与所述发起节点之间的关联值进行排序,得到由排序后的各个节点组成的序列,以及,将所述发起节点作为初始的账户社区;
导率获取步骤:提取当前所述序列中的首个节点,将当前提取的节点加入所述账户社区中,并获取所述账户社区当前的导率值;
判断所述账户社区当前的导率值是否连续预设次数下降,若是,则将当前账户社区中的除所述发起节点之外的节点均确定为内部关联关系满足预设的密切关联判定规则的节点;若否,则返回执行所述导率获取步骤;
应用内部关联关系满足预设的密切关联判定规则的节点和所述发起节点组成当前的高风险账户对应的风险账户社区。


8.根据权利要求1所述的异常交易账户群体识别方法,其特征在于,还包括:
若经所述局部社区挖掘步骤获取多个所述风险账户社区,且各个所述风险账户社区之间不满足预设的非相似要求,则对存在相似关系的所述风险账户社区进行合并,其中,所述非相似要求包括:各个所述风险账户社区之间不包含有相同的发起节点;
针对合并后的风险账户社区中的至少两个高风险账户,同时执行所述局部社区挖掘步骤,其中,合并后的风险账户社区中的至少两个高风险账户均为当前所述局部社区挖掘步骤中的发起节点,直至剩余的各个所述风险账户社区之间均满足预设的非相似要求。


9.根据权利要求1所述的异常交易账户群体识别方法,其特征在于,还包括:
若经所述局部社区挖掘步骤获取一个所述风险账户社区,则将该风险账户社区确定为所述目标金融机构的异常交易账户群体。

<...

【专利技术属性】
技术研发人员:纪耀宗贾玉红李晓萍赖昂
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1