涉诈订单预测模型训练方法和装置,订单预测方法和装置制造方法及图纸

技术编号:30708296 阅读:24 留言:0更新日期:2021-11-10 10:59
本公开提供一种涉诈订单预测模型训练方法和装置,订单预测方法和装置。训练装置以预定周期从数据库中提取出涉及诈骗的手机号码清单;根据手机号码清单获取相关联的诈骗号卡订单;提取诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本;将正样本和负样本提供给堆叠模型,其中将第一模型中的多个子模型的输出结果集成后,提供给第二模型以得到输出结果;利用输出结果同正样本和负样本的偏差确定损失函数值;根据损失函数值对堆叠模型进行训练,直至损失函数值满足预定条件为止。本公开通过利用经训练的堆叠模型,能够在号卡购买阶段进行防诈骗预测,有效提升防诈效果。有效提升防诈效果。有效提升防诈效果。

【技术实现步骤摘要】
涉诈订单预测模型训练方法和装置,订单预测方法和装置


[0001]本公开涉及信息
,特别涉及一种涉诈订单预测模型训练方法和装置,订单预测方法和装置。

技术介绍

[0002]目前的通信防诈骗主要采取在通话过程中黑名单拦截的方式。即从通话开始,针对主叫号码是否属于黑名单以进行拦截处理,直到通话结束为止。由于诈骗人频繁更换电话号码,黑名单号码实际占比很小,防诈骗效果往往未能达到预期。相关技术中还出现一种基于聚类算法的实时拦截诈骗电话的方案,其中通过采用聚类算法分簇来初步识别诈骗电话,并使用逻辑回归计算可疑度指数以实现进一步的过滤。
[0003]此外,在相关技术中,还通过语音识别技术进行分词处理,以识别出相应的诈骗关键词。

技术实现思路

[0004]专利技术人通过研究发现,在利用聚类算法进行诈骗电话拦截的过程中,各特征指标的区间范围需要依经验划分且需反复调整,逻辑回归中的所有权重值和极大似然值也要反复尝试,模型训练不确定因素多、难度大、调整时间长,泛化性能差。此外,在采用语音识别技术进行处理的过程中,需要增加新的通信网元来记录终端串号(与主叫号码不同)相关的诈骗和骚扰信息,从而需要改变通信网络结构,改造难度大成本高,且无法保证终端串号实时获得,在串号为空的情况下拦截效果差。
[0005]据此,本公开提供一种涉诈订单预测模型训练和涉诈订单预测方案,通过将诈骗行为发生后的被动防御,调整为在号卡购买阶段的防诈骗预测,有效提升防诈效果。
[0006]根据本公开实施例的第一方面,提供一种涉诈订单预测模型训练方法,包括:以预定周期从数据库中提取出涉及诈骗的手机号码清单;根据所述手机号码清单获取相关联的诈骗号卡订单;提取所述诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本;将所述正样本和所述负样本提供给堆叠模型中的第一模型,以便所述第一模型中的多个子模型分别对所述正样本和所述负样本进行处理,以分别得到对应的输出结果;将所述多个子模型的输出结果集成后,提供给所述堆叠模型中的第二模型,以得到所述堆叠模型的输出结果;利用所述堆叠模型的输出结果同所述正样本和所述负样本的偏差确定损失函数值;根据所述损失函数值对所述第一模型和所述第二模型进行训练,直至所述损失函数值满足预定条件为止。
[0007]在一些实施例中,根据所述手机号码清单获取相关联的诈骗号卡订单包括:根据所述手机号码清单中的每个手机号码,查询相关联的号卡订单;根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息;查询与所述入网用户身份证信息或收货用户手机号码相关联的号卡订单,然后重复执行根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息的步骤,直至查收出全部相关联的
号卡订单为止。
[0008]在一些实施例中,将查询出的号卡订单写入历史诈骗号卡订单库中。
[0009]在一些实施例中,所述第一模型中的多个子模型分别采用不同的分类器模型。
[0010]根据本公开实施例的第二方面,提供一种涉诈订单预测模型训练装置,包括:第一提取模块,被配置为以预定周期从数据库中提取出涉及诈骗的手机号码清单;订单获取模块,被配置为根据所述手机号码清单获取相关联的诈骗号卡订单;样本生成模块,被配置为提取所述诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本;训练模块,被配置为将所述正样本和所述负样本提供给堆叠模型中的第一模型,以便所述第一模型中的多个子模型分别对所述正样本和所述负样本进行处理,以分别得到对应的输出结果,将所述多个子模型的输出结果集成后,提供给所述堆叠模型中的第二模型,以得到所述堆叠模型的输出结果,利用所述堆叠模型的输出结果同所述正样本和所述负样本的偏差确定损失函数值,根据所述损失函数值对所述第一模型和所述第二模型进行训练,直至所述损失函数值满足预定条件为止。
[0011]在一些实施例中,订单获取模块被配置为根据所述手机号码清单中的每个手机号码,查询相关联的号卡订单,根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息,查询与所述入网用户身份证信息或收货用户手机号码相关联的号卡订单,然后重复执行根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息的步骤,直至查收出全部相关联的号卡订单为止。
[0012]在一些实施例中,订单获取模块还被配置为将查询出的号卡订单写入历史诈骗号卡订单库中。
[0013]在一些实施例中,所述第一模型中的多个子模型分别采用不同的分类器模型。
[0014]根据本公开实施例的第三方面,提供一种涉诈订单预测模型训练装置,包括:存储器,被配置为存储指令;处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的方法。
[0015]根据本公开实施例的第四方面,提供一种涉诈订单预测方法,包括:提取待预测的号卡订单的特征信息;将所提取的特征信息输入经上述任一实施例所述的涉诈订单预测模型训练方法所训练的涉诈订单预测模型,以获得所述待预测的号卡订单的预测结果;若所述预测结果指示所述待预测的号卡订单为涉诈订单,则进行相应的预警处理。
[0016]根据本公开实施例的第五方面,提供一种涉诈订单预测装置,包括:第二提取模块,被配置为提取待预测的号卡订单的特征信息;预测模块,被配置为将所提取的特征信息输入经上述任一实施例所述的涉诈订单预测模型训练方法所训练的涉诈订单预测模型,以获得所述待预测的号卡订单的预测结果;预警处理模块,被配置为若所述预测结果指示所述待预测的号卡订单为涉诈订单,则进行相应的预警处理。
[0017]根据本公开实施例的第六方面,提供一种涉诈订单预测装置,包括:存储器,被配置为存储指令;处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的方法。
[0018]根据本公开实施例的第七方面,提供一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上述任一实施例涉及的方法。
[0019]通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其
优点将会变得清楚。
附图说明
[0020]构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
[0021]参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
[0022]图1是根据本公开一个实施例的涉诈订单预测模型训练方法的流程示意图;
[0023]图2是根据本公开一个实施例的查询诈骗号卡订单方法的流程示意图;
[0024]图3是根据本公开一个实施例的涉诈订单预测模型的结构示意图;
[0025]图4是根据本公开一个实施例的决策树的示意图;
[0026]图5是根据本公开一个实施例的涉诈订单预测模型训练装置的结构示意图;
[0027]图6是根据本公开另一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种涉诈订单预测模型训练方法,包括:以预定周期从数据库中提取出涉及诈骗的手机号码清单;根据所述手机号码清单获取相关联的诈骗号卡订单;提取所述诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本;将所述正样本和所述负样本提供给堆叠模型中的第一模型,以便所述第一模型中的多个子模型分别对所述正样本和所述负样本进行处理,以分别得到对应的输出结果;将所述多个子模型的输出结果集成后,提供给所述堆叠模型中的第二模型,以得到所述堆叠模型的输出结果;利用所述堆叠模型的输出结果同所述正样本和所述负样本的偏差确定损失函数值;根据所述损失函数值对所述第一模型和所述第二模型进行训练,直至所述损失函数值满足预定条件为止。2.根据权利要求1所述的方法,其中,根据所述手机号码清单获取相关联的诈骗号卡订单包括:根据所述手机号码清单中的每个手机号码,查询相关联的号卡订单;根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息;查询与所述入网用户身份证信息或收货用户手机号码相关联的号卡订单,然后重复执行根据所述相关联的号卡订单查询相应的入网用户身份证信息和收货用户手机号码信息的步骤,直至查收出全部相关联的号卡订单为止。3.根据权利要求2所述的方法,还包括:将查询出的号卡订单写入历史诈骗号卡订单库中。4.根据权利要求1所述的方法,其中,所述第一模型中的多个子模型分别采用不同的分类器模型。5.一种涉诈订单预测模型训练装置,包括:第一提取模块,被配置为以预定周期从数据库中提取出涉及诈骗的手机号码清单;订单获取模块,被配置为根据所述手机号码清单获取相关联的诈骗号卡订单;样本生成模块,被配置为提取所述诈骗号卡订单的特征信息以生成负样本,提取与诈骗无关的卡号订单的特征信息以生成正样本;训练模块,被配置为将所述正样本和所述负样本提供给堆叠模型中的第一模型,以便所述第一模型中的多个子模型分别对所述正样本和所述负样本进行处理,以分别得到对应的输出结果,将所述多个子模型的输出结果集成后,提供给所述堆叠模型中的第二模型,以得到所述堆叠模型的输出结果,利用所述堆叠模型的输出结果同...

【专利技术属性】
技术研发人员:罗仕漳魏丫丫王健雷勇槐正王红波臧艳芳杨传信孙鹏
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1