诈骗识别模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36533504 阅读:16 留言:0更新日期:2023-02-01 16:17
本申请实施例提供了一种诈骗识别模型训练方法、装置、电子设备及存储介质。所述方法包括:根据欺诈业务数据,获取具有目标设备诈骗行为的多种类型特征的关键特征集;根据历史诈骗业务数据和所述关键特征集,获取目标设备对应的诈骗行为数据集;基于所述关键特征集和所述诈骗行为数据集对预先构建的诈骗识别模型进行训练,得到目标诈骗识别模型。本申请实施例结合具有目标设备诈骗行为的多种类型特征的关键特征集和诈骗行为数据集训练目标诈骗识别模型,能够提供细粒度的价值化参考数据,从而可以有效打击电信网络诈骗,保障人民群众的人身财产安全。同时,可以提高诈骗行为的检测准确度及检测效率。测准确度及检测效率。测准确度及检测效率。

【技术实现步骤摘要】
诈骗识别模型训练方法、装置、电子设备及存储介质


[0001]本申请涉及模型训练
,特别是涉及一种诈骗识别模型训练方法、装置、电子设备及存储介质。

技术介绍

[0002]随着电信诈骗的不断发展,越来越多诈骗分子使用“猫池”设备(如GOIP(GSM over Internet Protocol)设备等)进行电信网络诈骗。
[0003]通常情况下GOIP设备本身可以插卡使用,常规组网可以如图1所示,诈骗分子可以在境外通过网络远程控制GOIP设备进行诈骗,即使被公安抓获了GOIP设备和手机SIM卡和线下跑腿的人,也不会被抓到后端诈骗分子。
[0004]随着技术的进步,为了方便远程换卡,同时避免GOIP被抓获时手机SIM卡也被抓获,并给侦查工作增加难度,如图2所示,在组网中新增了卡池设备,位于A、B两地的不同GOIP设备通过网络可实现远程读卡,诈骗分子可以在GOIP设备上设置实现同一SIM卡在不同时间分别出现在A、B两地。
[0005]当前的猫池涉诈设备检测通常有以下几种方式:
[0006]1、基于实时通话数据、SIP话单分析SIP服务器,IP地址进行分析;
[0007]2、基于历史通话记录,通话位置基站进行分析;
[0008]3、基于家庭宽带/互联网的流量数据进行分析。
[0009]现有技术主要侧重于针对图1的传统组网下GOIP监测,并未对图2组网SIM卡在AB两地短时间异常切换的场景进行针对性监测,存在监测盲区。无法有效发现上述短时间内异常切换的GOIP细分场景。随着电信诈骗的不断发展,大量卡池被应用于诈骗,越来越多的涉诈场景出现了图2这类GOIP位于A、B两地远程读卡的情况,对公安侦破带来了很大的迷惑性,急需新的监测方式进行针对性识别,打击电信网络诈骗,保障人民群众的人身财产安全。
[0010]而且,现有技术中对于GOIP设备的多维度特征数据,采用固定公式和阈值监测远程GOIP设备,算法参数不可学习,不能自适应当前诈骗模式的行为变化,导致检测不准确、侦查不迅速。

技术实现思路

[0011]本申请实施例所要解决的技术问题是提供一种诈骗识别模型训练方法、装置、电子设备及存储介质,以结合获取具有目标设备诈骗行为的多种类型特征的关键特征集和诈骗行为数据集训练目标诈骗识别模型,能够提供细粒度的价值化参考数据,从而可以有效打击电信网络诈骗,保障人民群众的人身财产安全。同时,可以提高诈骗行为的检测准确度及检测效率。
[0012]第一方面,本申请实施例提供了一种诈骗识别模型训练方法,所述方法包括:
[0013]根据欺诈业务数据,获取获取具有目标设备诈骗行为的多种类型特征的关键特征
集;
[0014]根据历史诈骗业务数据和所述关键特征集,获取目标设备对应的诈骗行为数据集;
[0015]基于所述关键特征集和所述诈骗行为数据集对预先构建的诈骗识别模型进行训练,得到目标诈骗识别模型。
[0016]可选地,所述根据欺诈业务数据,获取具有目标设备诈骗行为的多种类型特征的关键特征集,包括:
[0017]提取所述欺诈业务数据中的设备行为类型的第一特征;
[0018]提取所述欺诈业务数据中的诈骗行为类型的第二特征;
[0019]提取所述欺诈业务数据中的位置切换速度类型的第三特征;
[0020]根据所述第一特征、所述第二特征和所述第三特征,生成所述目标设备诈骗行为的关键特征集。
[0021]可选地,所述提取所述欺诈业务数据中的设备行为类型的第一特征,包括:
[0022]提取所述欺诈业务数据中同一基站下多个号码在同一时刻以第一信号强度呼叫的第四特征;所述第一信号强度大于信号强度阈值;和/或
[0023]提取所述欺诈业务数据中同一基站下多个号码在同一时刻开机/关机的第五特征;和/或
[0024]提取所述欺诈业务数据中多个号码经过N个基站,且基站轨迹相同的第六特征;N为大于等于2的正整数;和/或
[0025]提取所述欺诈业务数据中号码呼叫间隔时间与机器拨打号码规律相同的第七特征;
[0026]将所述第四特征、和/或所述第五特征、和/或所述第六特征、和/或所述第七特征作为所述设备行为类型的第一特征。
[0027]可选地,所述提取所述欺诈业务数据中的诈骗行为类型的第二特征,包括:
[0028]提取所述欺诈业务数据中主呼叫量大于主叫阈值的第八特征;和/或
[0029]提取所述欺诈业务数据中主呼叫次数与主被呼叫次数的比值大于比例阈值的第九特征;和/或
[0030]提取所述欺诈业务数据中主呼叫挂断率大于挂断率阈值的第十特征;和/或
[0031]提取所述欺诈业务数据中主呼叫振铃时长大于时长阈值的第十一特征;和/或
[0032]提取所述欺诈业务数据中通话时长低于通话时长阈值的第十二特征;和/或
[0033]提取所述欺诈业务数据中通话时长在设定时长区间的比例的第十三特征;和/或
[0034]提取所述欺诈业务数据中呼叫号码的呼叫时间集中于设定时间区域的第十四特征;和/或
[0035]提取所述欺诈业务数据中被叫号码的重叠度低于重叠度阈值的第十五特征;和/或
[0036]提取所述欺诈业务数据中在同一时段内从同一基站发出呼叫的第十六特征;和/或
[0037]提取所述欺诈业务数据中在同一时段内的号码中存在强关联的号码的第十七特征;和/或
[0038]提取所述欺诈业务数据中拨打特殊号码的第十八特征;和/或
[0039]提取所述欺诈业务数据中号码活跃天数低于活跃天数阈值的第十九特征;和/或
[0040]提取所述欺诈业务数据中被叫号码归属地数量大于归属地数量阈值的第二十特征;
[0041]将所述第八特征、和/或所述第九特征、和/或所述第十特征、和/或所述第十一特征、和/或所述第十二特征、和/或所述第十三特征、和/或所述第十四特征、和/或所述第十五特征、和/或所述第十六特征、和/或所述第十七特征、和/或所述第十八特征、和/或所述第十九特征、和/或所述第二十特征,作为所述诈骗行为类型的第二特征。
[0042]可选地,所述提取所述欺诈业务数据中的位置切换速度类型的第三特征,包括:
[0043]提取所述欺诈业务数据中号码位置切换的平均速度大于速度阈值的特征,作为所述位置切换速度类型的第三特征。
[0044]可选地,所述根据历史诈骗业务数据和所述关键特征集,获取目标设备对应的诈骗行为数据集,包括:
[0045]对获取的历史诈骗业务数据进行预处理,得到预处理诈骗业务数据;
[0046]获取所述预处理诈骗业务数据对应的数据标签;
[0047]根据所述关键特征集计算得到所述预处理诈骗业务数据的目标维度的诈骗数据向量;
[0048]根据所述诈骗数据向量和所述数据标签,生成所述目标设备对应的诈骗行为数据集。
[0049]可选地,所述诈骗识别模型包括:若干本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种诈骗识别模型训练方法,其特征在于,所述方法包括:根据欺诈业务数据,获取具有目标设备诈骗行为的多种类型特征的关键特征集;根据历史诈骗业务数据和所述关键特征集,获取目标设备对应的诈骗行为数据集;基于所述关键特征集和所述诈骗行为数据集对预先构建的诈骗识别模型进行训练,得到目标诈骗识别模型。2.根据权利要求1所述的方法,其特征在于,所述根据欺诈业务数据,获取具有目标设备诈骗行为的多种类型特征的关键特征集,包括:提取所述欺诈业务数据中的设备行为类型的第一特征;提取所述欺诈业务数据中的诈骗行为类型的第二特征;提取所述欺诈业务数据中的位置切换速度类型的第三特征;根据所述第一特征、所述第二特征和所述第三特征,生成所述目标设备诈骗行为的关键特征集。3.根据权利要求2所述的方法,其特征在于,所述提取所述欺诈业务数据中的设备行为类型的第一特征,包括:提取所述欺诈业务数据中同一基站下多个号码在同一时刻以第一信号强度呼叫的第四特征,其中,所述第一信号强度大于信号强度阈值;和/或提取所述欺诈业务数据中同一基站下多个号码在同一时刻开机/关机的第五特征;和/或提取所述欺诈业务数据中多个号码经过N个基站,且基站轨迹相同的第六特征,N为大于等于2的正整数;和/或提取所述欺诈业务数据中号码呼叫间隔时间与机器拨打号码规律相同的第七特征;将所述第四特征、和/或所述第五特征、和/或所述第六特征、和/或所述第七特征,作为所述设备行为类型的第一特征。4.根据权利要求2所述的方法,其特征在于,所述提取所述欺诈业务数据中的诈骗行为类型的第二特征,包括:提取所述欺诈业务数据中主呼叫量大于主叫阈值的第八特征;和/或提取所述欺诈业务数据中主呼叫次数与主被呼叫次数的比值大于比例阈值的第九特征;和/或提取所述欺诈业务数据中主呼叫挂断率大于挂断率阈值的第十特征;和/或提取所述欺诈业务数据中主呼叫振铃时长大于时长阈值的第十一特征;和/或提取所述欺诈业务数据中通话时长低于通话时长阈值的第十二特征;和/或提取所述欺诈业务数据中通话时长在设定时长区间的比例的第十三特征;和/或提取所述欺诈业务数据中呼叫号码的呼叫时间集中于设定时间区域的第十四特征;和/或提取所述欺诈业务数据中被叫号码的重叠度低于重叠度阈值的第十五特征;和/或提取所述欺诈业务数据中在同一时段内从同一基站发出呼叫的第十六特征;和/或提取所述欺诈业务数据中在同一时段内的号码中存在强关联的号码的第十七特征;和/或提取所述欺诈业务数据中拨打特殊号码的第十八特征;和/或
提取所述欺诈业务数据中号码活跃天数低于活跃天数阈值的第十九特征;和/或提取所述欺诈业务数据中被叫号码归属地数量大于归属地数量阈值的第二十特征;将所述第八特征、和/或所述第九特征、和/或所述第十特征、和/或所述第十一特征、和/或所述第十二特征、和/或所述第十三特征、和/或所述第十四特征、和/或所述第十五特征、和/或所述第十六特征、和/或所述第十七特征、和/或所述第十八特征、和/或所述第十九特征、和/或所述第二十特征,作为所述诈骗行为类型的第二特征。5.根据权利要求2所述的方法,其特征在于,所述提...

【专利技术属性】
技术研发人员:何志伟何全胜邹晓聪祝安邦蓝子扬黄贝珊郦敏懿
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1