一种电信诈骗事件检测方法和检测系统技术方案

技术编号:20844317 阅读:53 留言:0更新日期:2019-04-13 08:55
本发明专利技术提供了一种电信诈骗事件检测方法和检测系统,其利用构建的电信诈骗事件检测模型来预测诈骗模式。诈骗事件检测模型的构建包括:基于已有的诈骗行为数据建立反映不同时间序列通联模式的动态通联图;基于所述动态通联图挖掘存在诈骗行为的异常子图序列,其中,所述异常子图序列由异常节点、与异常节点关联的节点和边构成;基于所述异常子图序列训练多分类模型,获得用于检测多种诈骗模式的电信诈骗事件检测模型。利用本发明专利技术的检测方法和检测系统,能够快速、准确的预测诈骗行为。

【技术实现步骤摘要】
一种电信诈骗事件检测方法和检测系统
本专利技术涉及机器学习
,尤其涉及一种电信诈骗事件检测方法和检测系统。
技术介绍
目前,电信诈骗一般以团伙作案为基础,通常利用号码篡改、伪装等方式,针对特定的个体在一段时间内开展有套路、有剧本的精准诈骗活动,多点动态通联诈骗甚至跨境实施,单一的国际关口的监测都无法还原欺诈通联模式的变化。这类欺诈活动通常会造成重大损失,具有极高的社会危害性。在此过程中,诈骗群体对应的通联关系以及伴随的呼叫模式也会随之发生动态演变。尽管传统的模板匹配、信令的统计分析和单纯的国际关口检测等传统的犯罪检测方法能够在一定程度上遏制一些传统的诈骗事件,但是诈骗团伙的诈骗方式和伪装在不断的演化,诈骗形式复杂多样,而传统针对单点欺诈的电话诈骗检测方法又存在数据采集速度慢、难以整理庞大数据量的问题,最终导致传统的检测方法效率比较低。然而,在现有技术中,还没有针对团伙的、具有复杂诈骗模式及通联关系的、多点跨境实施的、具有动态演化特征的欺诈手法的分析挖掘能力。因此,急需在现有静态、单通话的信令分析基础上,研究疑似诈骗电话的通联关系结构的动态演化模式,融合利用国际和省际通联数据,更有效地检测识别诈骗团伙的行为手段,并且在结构的演化过程中检测分析各类诈骗事件(包括事件过程、欺诈及受害群体特征等),从而为公安部门、通信监管部门提供决策支持,将诈骗管控的关口前移,提升对于新型诈骗的防范能力。因此,需要对现有技术进行改进,以提供更有效的诈骗事件检测方法。
技术实现思路
本专利技术的目的在于克服上述现有技术的缺陷,提供一种电信诈骗事件检测方法和检测系统,能够基于动态通联图准确快速的检测电信诈骗事件。根据本专利技术的第一方面,提供了一种构建电信诈骗事件检测模型的方法。该方法包括以下步骤:步骤1:基于已有的诈骗行为数据建立反映不同时间序列通联模式的动态通联图;步骤2:基于所述动态通联图挖掘存在诈骗行为的异常子图序列,其中,所述异常子图序列由异常节点、与异常节点关联的节点和边构成;步骤3:基于所述异常子图序列训练多分类模型,获得用于检测多种诈骗模式的电信诈骗事件检测模型。在一个实施例中,步骤2包括:步骤21:基于所述动态通联图的结构特征、动态演变特征或节点特征中的至少一项初步挖掘异常子图序列;步骤22:基于所述初步挖掘的异常子图序列训练二分类模型,获得经过二次筛选的异常子图序列,作为所述存在诈骗行为的异常子图序列。在一个实施例中,步骤21中,在基于所述动态通联图的动态演变特征初步挖掘异常子图序列的情况下,包括:步骤211:将所述动态通联图中转换为自我中心网络图;步骤212:基于不同时间序列的自我中心网络图提取图结构距离和图编辑距离;步骤213:基于所述图结构距离和图编辑距离获得初步挖掘的异常子图序列。在一个实施例中,在步骤21中,在基于所述动态通联图的结构特征初步挖掘异常子图序列的情况下,基于节点度数、中介中心性、接近中心性、聚类系数中的至少一项获得初步挖掘的异常子图序列。在一个实施例中,步骤22包括:以所述初步挖掘的异常子图序列作为训练数据,标记为异常的数据作为正样本,标记为正常的数据作为负样本,结合长短时记忆网络训练二分类模型。在一个实施例中,本专利技术的方法还包括:步骤4:当出现新型诈骗模式时,利用自组织增量学习神经网络通过增量学习来更新所构建的电信诈骗事件检测模型。在一个实施例中,所述动态通联图的节点表示用户信息,边表示用户间的呼叫关系,边的权重表示用户间的呼叫频率。根据本专利技术的第二方面,提供了一种电信诈骗事件检测方法。该方法包括:步骤81:获取电信数据并构建动态通联图;步骤82:基于所构建的动态通联图,利用本专利技术所构建的电信诈骗事件检测模型来预测诈骗模式。根据本专利技术的第三方面,提供了一种电信诈骗事件检测系统。该系统包括:数据采集模块:获取采集电信数据并构建动态通联图;特征提取模块:基于所构建的动态通联图提取所述动态通联图的结构特征、动态演变特征或节点特征中的至少一项;诈骗事件检测模块:基于提取的特征,利用本专利技术所构建的电信诈骗事件检测模型来预测诈骗模式。在一个实施例中,本专利技术的系统还包括增量学习模块和诈骗预警阻断模块,其中,所述增量学习模块用于更新所构建的电信诈骗事件检测模型,所述诈骗预警阻断模块根据所述诈骗事件检测模块输出的诈骗模式进行疑似诈骗事件推荐和发现新型诈骗模式。与现有技术相比,本专利技术的优点在于:通过对动态通联关系结构进行深度特征提取能够挖掘在给定连续时间序列的电信网络通联图中找出有效的找出异常节点;基于异常节点通过模型训练,能够获得面向不同诈骗类型的检测模型;通过增量学习训练,能够实现对电信诈骗模型的快速迭代更新,减少重复训练过程。本专利技术提供的诈骗事件检测方法能够快速、准确的检测不同类型的诈骗模式。附图说明以下附图仅对本专利技术作示意性的说明和解释,并不用于限定本专利技术的范围,其中:图1是根据本专利技术一个实施例的电信诈骗事件检测方法的流程图;图2是电话网络通联图的示意图;图3是动态EgoNet网络的示意图;图4是基于LSTM筛选异常信息的过程示意图;图5是残差网络ResNet块结构图;图6是SOINN的两层竞争示意图图7是根据本专利技术一个实施例的电信诈骗事件检测系统的示意图;图8是图7的电信诈骗事件检测系统中诈骗预警阻断模块的反馈机制流程图。具体实施方式为了使本专利技术的目的、技术方案、设计方法及优点更加清楚明了,以下结合附图通过具体实施例对本专利技术进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。根据本专利技术的一个实施例,提供了一种电信诈骗事件检测方法,简言之,该方法基于电信网络的动态通联图提取关键特征,利用关键特征训练来获得诈骗模式检测模型,并根据获得的检测模型对新的动态通联图进行检测,以预测电信诈骗事件。具体地,参见图1所示,本专利技术的实施例包括以下步骤、步骤S110,采集已有的诈骗行为数据,构建动态通联图。在此步骤,采集通信网络中已有的历史通信数据,构建连续时间序列的动态通联图。在本文中,动态通联图可用于反映不同时刻通信人(或称用户)之间的通信关系和通信人的信息等。采集的通信数据例如包括通信时长、通信人的身份地址、手机号、地理位置、社会关系、通信内容中的关键词等。在一个实施例中,移动数据端通过接收短信消息、来电消息等获取通信数据。在构建动态通联图时,以例如通信时长、通信人的身份地址或通信内容中的关键词等作为整个通信网络的节点,而通信人之间的通联关系、地理距离等信息作为通信网络的边数据。通过这种方式,可将同一个时间段内的通信关系抽象为一个静态图模型,而连续多个时间段内的静态图模型的数据变化可作为动态通联图。参见图2示意的通联图,其由节点和边构成,其中的数字用于标识节点和边,各节点和各边的数据可来自于已对历史数据进行标记的数据库,即已经标记了那些数据属于诈骗数据,以及对应那种诈骗模式。对于动态通联图的构建,可根据大数据关联属性数据,基于国际和省级层面的呼叫相关数据,将传统电信网络的呼叫关系用通联关系结构图(简称通联图)来描述,其中,通联图的节点表示用户,通联图的边代表用户间的呼叫关系,边的权重则用来描述用户间的呼叫频率(次数)。随着时间的演化,用户之间的呼叫关系是复杂动态变化的,本文档来自技高网...

【技术保护点】
1.一种构建电信诈骗事件检测模型的方法,包括以下步骤:步骤1:基于已有的诈骗行为数据建立反映不同时间序列通联模式的动态通联图;步骤2:基于所述动态通联图挖掘存在诈骗行为的异常子图序列,其中,所述异常子图序列由异常节点、与异常节点关联的节点和边构成;步骤3:基于所述异常子图序列训练多分类模型,获得用于检测多种诈骗模式的电信诈骗事件检测模型。

【技术特征摘要】
1.一种构建电信诈骗事件检测模型的方法,包括以下步骤:步骤1:基于已有的诈骗行为数据建立反映不同时间序列通联模式的动态通联图;步骤2:基于所述动态通联图挖掘存在诈骗行为的异常子图序列,其中,所述异常子图序列由异常节点、与异常节点关联的节点和边构成;步骤3:基于所述异常子图序列训练多分类模型,获得用于检测多种诈骗模式的电信诈骗事件检测模型。2.根据权利要求1所述的方法,其中,步骤2包括:步骤21:基于所述动态通联图的结构特征、动态演变特征或节点特征中的至少一项初步挖掘异常子图序列;步骤22:基于所述初步挖掘的异常子图序列训练二分类模型,获得经过二次筛选的异常子图序列,作为所述存在诈骗行为的异常子图序列。3.根据权利要求2所述的方法,其中,步骤21中,在基于所述动态通联图的动态演变特征初步挖掘异常子图序列的情况下,包括:步骤211:将所述动态通联图中转换为自我中心网络图;步骤212:基于不同时间序列的自我中心网络图提取图结构距离和图编辑距离;步骤213:基于所述图结构距离和图编辑距离获得初步挖掘的异常子图序列。4.根据权利要求2所述的方法,其中,在步骤21中,在基于所述动态通联图的结构特征初步挖掘异常子图序列的情况下,基于节点度数、中介中心性、接近中心性、聚类系数中的至少一项获得初步挖掘的异常子图序列。5.根据权利要求2所述的方法,其中,步骤22包括:以所述初步挖掘的异常子图序列作为训练数据,标记为异常的数据作为正样本,标记为正常的数据作为负样本,结合长短时记忆网络训练二分类模...

【专利技术属性】
技术研发人员:贾瑞花张承龙曹华伟叶笑春范东睿
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1