【技术实现步骤摘要】
风险特征筛选、描述报文生成方法、装置以及电子设备
本说明书涉及计算机
,尤其涉及风险特征筛选、描述报文生成方法、装置以及电子设备。
技术介绍
随着互联网金融的快速发展,互联网金融交易的数量在快速增长。在大量的互联网金融交易中,可能存在一些不法人员进行洗钱等非法交易。因此,需要工作人员从大量交易记录中查找到可疑交易,并生成对应的可疑交易描述报文,反馈到有关管理部门,这些可疑交易也可以称为风险事件。在现有技术中,接收到可疑交易数据后,通常通过工作人员根据这些数据,按照预定义的报文模板以人工方式编写描述可疑交易的报文,其中,报文长度是受到限制的。基于现有技术,需要能够基于报文长度约束条件,针对可疑交易生成更有参考性的描述报文的方案。
技术实现思路
本说明书实施例提供风险特征筛选、描述报文生成方法、装置以及电子设备,用于解决以下技术问题:需要能够基于报文长度约束条件,针对可疑交易生成更有参考性的描述报文的方案。为解决上述技术问题,本说明书实施例是这样实现的:本说明书实施例提供一种风险特征筛选方法,包括:获取多个风险特征分别的特征权重,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件;根据所述特征权重和预定条件,筛选出至少部分风险特征,所述预定条件用于约束根据风险特征所生成报文的长度。本说明书实施例提供的一种描述报文生成方法,包括:获取待描述事件;确定筛选出的各风险特征;根据所述筛选出的各风险特征,为所述待描述事件生成描述报文;其中,所述筛选出各风险特征包括:获取多个风险特征分别的特征权重,根据所述特征权重和预定条件, ...
【技术保护点】
一种风险特征筛选方法,包括:获取多个风险特征分别的特征权重,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件;根据所述特征权重和预定条件,筛选出至少部分风险特征,所述预定条件用于约束根据风险特征所生成报文的长度。
【技术特征摘要】
1.一种风险特征筛选方法,包括:获取多个风险特征分别的特征权重,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件;根据所述特征权重和预定条件,筛选出至少部分风险特征,所述预定条件用于约束根据风险特征所生成报文的长度。2.如权利要求1所述的方法,根据利用样本事件训练得到的分类模型得到所述特征权重,具体包括:利用样本事件训练得到分类模型;分别针对所述多个风险特征执行:获取所述样本事件中对应于该风险特征的数据;根据所述对应于该风险特征的数据,计算该风险特征对应于所述分类模型的分类准确性度量指标;根据该分类准确性度量指标,得到该风险特征的特征权重。3.如权利要求1所述的方法,所述多个风险特征分别有对应的子报文字数;所述根据所述特征权重和预定条件,筛选出至少部分风险特征,具体包括:根据所述特征权重及对应的所述子报文字数,对所述多个风险特征进行第一排序;根据所述第一排序结果、所述子报文字数,以及预定条件,筛选出至少部分风险特征。4.如权利要求3所述的方法,所述根据所述特征权重及对应的所述子报文字数,对所述多个风险特征进行第一排序,具体包括:确定所述多个风险特征按照所述特征权重大小,进行第二排序得到的第二排序结果;根据所述第二排序结果,选取所述多个风险特征中的至少部分风险特征;根据所述特征权重及对应的所述子报文字数,对所述选取的风险特征进行第一排序。5.如权利要求3所述的方法,所述根据所述特征权重及对应的所述子报文字数,对所述多个风险特征进行第一排序,具体包括:根据所述风险特征对应的所述特征权重和所述子报文字数,计算所述风险特征对应的单位字数权重;按照所述单位字数权重,对所述多个风险特征进行第一排序。6.如权利要求3所述的方法,所述根据所述第一排序结果、所述子报文字数,以及预定条件,筛选出至少部分风险特征,具体包括:根据所述第一排序结果,针对所述第一排序结果包含的各风险特征,按照单位字数权重从大到小的顺序,进行遍历,针对当前风险特征执行:将当前风险特征加入设定集合,判断所述设定集合中包含的风险特征对应的子报文字数之和是否符合预定条件;若是,遍历至下一个风险特征;否则,将当前风险特征从所述设定集合中剔除,结束遍历过程,将所述设定集合中包含的风险特征作为筛选出的至少部分风险特征;其中,所述设定集合初始时为空集。7.如权利要求6所述的方法,所述遍历至下一个风险特征,具体包括:确定所述设定集合对应于所述分类模型的分类准确性度量指标;判断该分类准确性度量指标是否不大于加入当前风险特征前的所述设定集合对应于所述分类模型的分类准确性度量指标;若是,将当前风险特征从所述设定集合中剔除,遍历至下一个风险特征;否则,遍历至下一个风险特征。8.如权利要求2或7所述的方法,所述分类准确性度量指标包括受试者工作特征曲线线下面积AUC。9.如权利要求1~7任一项所述的方法,所述方法还包括:获取待描述事件;分别针对筛选出至少部分风险特征,生成对应于所述待描述事件的子报文,根据各所述子报文,为所述待描述事件生成描述报文。10.如权利要求9所述的方法,所述待描述事件被所述分类模型判定为风险事件,所述风险事件为疑似洗钱交易。11.一种描述报文生成方法,包括:获取待描述事件;确定筛选出的各风险特征;根据所述筛选出的各风险特征,为所述待描述事件生成描述报文;其中,所述筛选出各风险特征包括:获取多个风险特征分别的特征权重,根据所述特征权重和预定条件,筛选出所述各风险特征,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件,所述预定条件用于约束根据风险特征所生成报文的长度。12.一种风险特征筛选装置,包括:获取模块,获取多个风险特征分别的特征权重,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件;筛选模块,根据所述特征权重和预定条件,筛选出至少部分风险特征,所述预定条件用于约束根据风险特征所生成报文的长度。13.如权利要求12所述的装置,所述装置还包括权重确定模块;所述权重确定模块根据利用样本事件训练得到的分类模型得到所述特征权重,具体包括:所述权重确定模块利用样本事件训练得到分类模型;分别针对所述多个风险特征执行:获取所述样本事件中对应于该风险特征的数据;根据所述对应于该风险特征的数据,计算该风险特征对应于所述分类模型的分类准确性度量指标;根据该分类准确性...
【专利技术属性】
技术研发人员:张鹏,印晓华,张向阳,薛峰,顾曦,郭倩婷,屠剑威,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。