风险特征筛选、描述报文生成方法、装置以及电子设备制造方法及图纸

技术编号:17250269 阅读:26 留言:0更新日期:2018-02-11 08:53
本说明书实施例公开了风险特征筛选、描述报文生成方法、装置以及电子设备,所述方法包括:根据多个风险特征的特征权重,以及用于约束根据风险特征所生成报文的长度的预定条件,筛选风险特征,进而,可以利用筛选出的风险特征为待描述事件生成描述报文。

【技术实现步骤摘要】
风险特征筛选、描述报文生成方法、装置以及电子设备
本说明书涉及计算机
,尤其涉及风险特征筛选、描述报文生成方法、装置以及电子设备。
技术介绍
随着互联网金融的快速发展,互联网金融交易的数量在快速增长。在大量的互联网金融交易中,可能存在一些不法人员进行洗钱等非法交易。因此,需要工作人员从大量交易记录中查找到可疑交易,并生成对应的可疑交易描述报文,反馈到有关管理部门,这些可疑交易也可以称为风险事件。在现有技术中,接收到可疑交易数据后,通常通过工作人员根据这些数据,按照预定义的报文模板以人工方式编写描述可疑交易的报文,其中,报文长度是受到限制的。基于现有技术,需要能够基于报文长度约束条件,针对可疑交易生成更有参考性的描述报文的方案。
技术实现思路
本说明书实施例提供风险特征筛选、描述报文生成方法、装置以及电子设备,用于解决以下技术问题:需要能够基于报文长度约束条件,针对可疑交易生成更有参考性的描述报文的方案。为解决上述技术问题,本说明书实施例是这样实现的:本说明书实施例提供一种风险特征筛选方法,包括:获取多个风险特征分别的特征权重,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件;根据所述特征权重和预定条件,筛选出至少部分风险特征,所述预定条件用于约束根据风险特征所生成报文的长度。本说明书实施例提供的一种描述报文生成方法,包括:获取待描述事件;确定筛选出的各风险特征;根据所述筛选出的各风险特征,为所述待描述事件生成描述报文;其中,所述筛选出各风险特征包括:获取多个风险特征分别的特征权重,根据所述特征权重和预定条件,筛选出所述各风险特征,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件,所述预定条件用于约束根据风险特征所生成报文的长度。本说明书实施例提供的一种风险特征筛选装置,包括:获取模块,获取多个风险特征分别的特征权重,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件;筛选模块,根据所述特征权重和预定条件,筛选出至少部分风险特征,所述预定条件用于约束根据风险特征所生成报文的长度。本说明书实施例提供的一种描述报文生成装置,包括:获取模块,获取待描述事件;确定模块,确定筛选出的各风险特征;生成模块,根据所述筛选出的各风险特征,为所述待描述事件生成描述报文;其中,所述筛选出各风险特征包括:获取多个风险特征分别的特征权重,根据所述特征权重和预定条件,筛选出所述各风险特征,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件,所述预定条件用于约束根据风险特征所生成报文的长度。本说明书实施例提供的一种风险特征筛选电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取多个风险特征分别的特征权重,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件;根据所述特征权重和预定条件,筛选出至少部分风险特征,所述预定条件用于约束根据风险特征所生成报文的长度。本说明书实施例提供的一种描述报文生成电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取待描述事件;确定筛选出的各风险特征;根据所述筛选出的各风险特征,为所述待描述事件生成描述报文;其中,所述筛选出各风险特征包括:获取多个风险特征分别的特征权重,根据所述特征权重和预定条件,筛选出所述各风险特征,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件,所述预定条件用于约束根据风险特征所生成报文的长度。本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:可以利用训练得到的分类模型,确定各风险特征分别的特征权重,根据特征权重,以及用于约束根据风险特征所生成报文的长度的预定条件,为待描述事件生成描述报文,从而生成的描述报文更有参考性;其中,待描述事件比如可以是疑似洗钱交易等可疑交易。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本说明书的方案在一种实际应用场景下涉及的一种整体架构示意图;图2为本说明书实施例提供的一种风险特征筛选方法的流程示意图;图3为本说明书实施例提供的一种描述报文生成方法的流程示意图;图4为本说明书实施例提供的描述报文的部分截图的示意图;图5为本说明书实施例提供的一种自动报文算法的示意图;图6为本说明书实施例提供的一种实际应用场景下的可疑交易甄别流程示意图;图7为本说明书实施例提供的对应于图2的一种风险特征筛选装置的结构示意图;图8为本说明书实施例提供的对应于图3的一种描述报文生成装置的结构示意图。具体实施方式本说明书实施例提供风险特征筛选、描述报文生成方法、装置以及电子设备。为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。为了便于理解,对本说明书的方案的思路进行分析。在没有报文长度约束条件的情况下,可以使描述报文覆盖可疑交易的全部信息点,其中,每个信息点分别反映可疑交易的其中一个风险特征的数据,比如,信息点是根据风险特征生成的子报文。将由全部风险特征构成的集合记作S。而在有报文长度约束条件的情况下,描述报文通常只能覆盖可疑交易的一部分风险特征数据而不是全部,否则报文长度将会超限。那么,为了使生成的描述报文参考性尽量高,需要对风险特征进行筛选,以筛选出参考价值最高的风险特征子集合,风险特征子集合记作假定利用分类模型的受试者工作特征曲线线下面积(AreaUnderrocCurve,AUC)来度量S'的参考价值。一种理想的目标是:筛选得到对应的AUC最大的S'。该理想的目标属于组合优化问题,在风险特征数量较多时,计算量很大不利于实用,基于此,本说明书的方案利用贪心搜索策略,对该组合优化问题进行近似求解,求得局部最优解即可,如此可以减少计算量,效率较高。本说明书的方案可以用于:在一个待筛选风险特征集合中,筛选参考价值相对高的风险特征;进一步地可以用于利用筛选出的风险特征,为诸如可疑交易等风险事件生成描述报文。图1为本说明书的方案在一种实际应用场景下涉及的一种整体架构示意图。该整体架构包括至少一个设备,设备工作流程主要包括:确定待筛选的多个风险特征,以及筛选出至少部分风险特征;以及输入待描述事件到用于生成描本文档来自技高网
...
风险特征筛选、描述报文生成方法、装置以及电子设备

【技术保护点】
一种风险特征筛选方法,包括:获取多个风险特征分别的特征权重,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件;根据所述特征权重和预定条件,筛选出至少部分风险特征,所述预定条件用于约束根据风险特征所生成报文的长度。

【技术特征摘要】
1.一种风险特征筛选方法,包括:获取多个风险特征分别的特征权重,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件;根据所述特征权重和预定条件,筛选出至少部分风险特征,所述预定条件用于约束根据风险特征所生成报文的长度。2.如权利要求1所述的方法,根据利用样本事件训练得到的分类模型得到所述特征权重,具体包括:利用样本事件训练得到分类模型;分别针对所述多个风险特征执行:获取所述样本事件中对应于该风险特征的数据;根据所述对应于该风险特征的数据,计算该风险特征对应于所述分类模型的分类准确性度量指标;根据该分类准确性度量指标,得到该风险特征的特征权重。3.如权利要求1所述的方法,所述多个风险特征分别有对应的子报文字数;所述根据所述特征权重和预定条件,筛选出至少部分风险特征,具体包括:根据所述特征权重及对应的所述子报文字数,对所述多个风险特征进行第一排序;根据所述第一排序结果、所述子报文字数,以及预定条件,筛选出至少部分风险特征。4.如权利要求3所述的方法,所述根据所述特征权重及对应的所述子报文字数,对所述多个风险特征进行第一排序,具体包括:确定所述多个风险特征按照所述特征权重大小,进行第二排序得到的第二排序结果;根据所述第二排序结果,选取所述多个风险特征中的至少部分风险特征;根据所述特征权重及对应的所述子报文字数,对所述选取的风险特征进行第一排序。5.如权利要求3所述的方法,所述根据所述特征权重及对应的所述子报文字数,对所述多个风险特征进行第一排序,具体包括:根据所述风险特征对应的所述特征权重和所述子报文字数,计算所述风险特征对应的单位字数权重;按照所述单位字数权重,对所述多个风险特征进行第一排序。6.如权利要求3所述的方法,所述根据所述第一排序结果、所述子报文字数,以及预定条件,筛选出至少部分风险特征,具体包括:根据所述第一排序结果,针对所述第一排序结果包含的各风险特征,按照单位字数权重从大到小的顺序,进行遍历,针对当前风险特征执行:将当前风险特征加入设定集合,判断所述设定集合中包含的风险特征对应的子报文字数之和是否符合预定条件;若是,遍历至下一个风险特征;否则,将当前风险特征从所述设定集合中剔除,结束遍历过程,将所述设定集合中包含的风险特征作为筛选出的至少部分风险特征;其中,所述设定集合初始时为空集。7.如权利要求6所述的方法,所述遍历至下一个风险特征,具体包括:确定所述设定集合对应于所述分类模型的分类准确性度量指标;判断该分类准确性度量指标是否不大于加入当前风险特征前的所述设定集合对应于所述分类模型的分类准确性度量指标;若是,将当前风险特征从所述设定集合中剔除,遍历至下一个风险特征;否则,遍历至下一个风险特征。8.如权利要求2或7所述的方法,所述分类准确性度量指标包括受试者工作特征曲线线下面积AUC。9.如权利要求1~7任一项所述的方法,所述方法还包括:获取待描述事件;分别针对筛选出至少部分风险特征,生成对应于所述待描述事件的子报文,根据各所述子报文,为所述待描述事件生成描述报文。10.如权利要求9所述的方法,所述待描述事件被所述分类模型判定为风险事件,所述风险事件为疑似洗钱交易。11.一种描述报文生成方法,包括:获取待描述事件;确定筛选出的各风险特征;根据所述筛选出的各风险特征,为所述待描述事件生成描述报文;其中,所述筛选出各风险特征包括:获取多个风险特征分别的特征权重,根据所述特征权重和预定条件,筛选出所述各风险特征,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件,所述预定条件用于约束根据风险特征所生成报文的长度。12.一种风险特征筛选装置,包括:获取模块,获取多个风险特征分别的特征权重,所述特征权重根据利用样本事件训练得到的分类模型得到或者预定义得到,所述分类模型用于判定风险事件;筛选模块,根据所述特征权重和预定条件,筛选出至少部分风险特征,所述预定条件用于约束根据风险特征所生成报文的长度。13.如权利要求12所述的装置,所述装置还包括权重确定模块;所述权重确定模块根据利用样本事件训练得到的分类模型得到所述特征权重,具体包括:所述权重确定模块利用样本事件训练得到分类模型;分别针对所述多个风险特征执行:获取所述样本事件中对应于该风险特征的数据;根据所述对应于该风险特征的数据,计算该风险特征对应于所述分类模型的分类准确性度量指标;根据该分类准确性...

【专利技术属性】
技术研发人员:张鹏印晓华张向阳薛峰顾曦郭倩婷屠剑威
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1