风险信息确定方法、模型训练方法、设备、程序产品技术

技术编号:31229809 阅读:25 留言:0更新日期:2021-12-08 09:59
本公开提供的风险信息确定方法、模型训练方法、设备、程序产品,包括:获取业务活动的待评估业务数据;待评估业务数据包括多个数据特征,每个数据特征对应于一个特征域;将与同一特征域对应的数据特征输入与特征域对应的编码网络,得到与特征域对应的特征向量;将与特征域对应的特征向量输入注意力层,得到包括各个特征向量之间关系的总向量;将总向量输入确定子模块,利用确定子模块确定与待评估业务数据对应的期望;根据期望确定与待评估业务数据对应的风险信息。本公开提供的方案通过与特征域对应的编码网络,对属于该特征域的数据特征进行处理,得到该特征域的特征向量,进而准确的提取业务活动的特征向量,能够准确的得到风险评估结果。险评估结果。险评估结果。

【技术实现步骤摘要】
风险信息确定方法、模型训练方法、设备、程序产品


[0001]本公开涉及人工智能技术,尤其涉及一种风险信息确定方法、模型训练方法、设备、程序产品。

技术介绍

[0002]目前,网络购物平台已经发展的越来越成熟,各个网络购物平台也会推出多种优惠活动,以促进商品的成交量。随着优惠活动的增多,催生了基于网络购物平台的黑灰产业。一些用户储备大量的网络购物平台的账号,并利用这些账号参与优惠活动,进行套利。
[0003]为了应对网络购物平台的黑灰产业,现有技术中存风险评估技术,通过对用户参与优惠活动的全链路各个环节进行风险评估,是防止黑灰产业的有效手段。风险评估技术又分为基于规则的风险评估方法,以及基于算法模型的风险评估方法。
[0004]其中,基于规则的风险评估方法对专家经验的依赖性较强,且规则发布周期长,对黑灰产业的打击相对滞后。而基于算法模型的风险评估方法中,由于参与优惠活动产生的数据不仅特征维度高,且稀疏性强,传统的建模或者神经网络结构,无法有效的学习到这些数据的特性。

技术实现思路

[0005]本公开提供一种风险信息本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种业务活动的风险信息确定方法,其特征在于,包括:获取与所述业务活动对应的待评估业务数据;所述待评估业务数据包括多个数据特征,每个所述数据特征对应于一个特征域;将与同一特征域对应的所述数据特征,输入与所述特征域对应的编码网络,得到与所述特征域对应的特征向量;将与所述特征域对应的特征向量输入注意力层,得到包括各个所述特征向量之间关系的总向量;将所述总向量输入确定子模块,利用所述确定子模块确定与所述待评估业务数据对应的期望;根据所述期望确定与所述待评估业务数据对应的风险信息,所述风险信息用于指示所述待评估业务数据的风险程度。2.根据权利要求1所述的方法,其特征在于,所述将与所述特征域对应的特征向量输入注意力层,得到包括各个所述特征向量之间关系的总向量,包括:根据与各个特征域对应的所述特征向量,确定每两个特征向量之间的特征相似度;根据各个特征相似度,确定包括各个所述特征向量之间关系的总向量。3.根据权利要求2所述的方法,其特征在于,所述根据每两个特征向量之间的特征相似度,确定包括各个所述特征向量之间关系的总向量,包括:根据每个特征向量与其他特征向量之间的特征相似度,确定每个特征向量与其他特征向量之间的关系系数,所述关系系数用于表征两个特征向量之间的关系;根据每个特征向量与其他特征向量之间的关系系数、每个所述特征向量,确定每个特征向量的特征域嵌入向量;其中,所述特征域嵌入向量用于表征嵌入有其他特征向量信息的特征向量;根据各特征域嵌入向量,确定包括各个所述特征向量之间关系的总向量。4.根据权利要求1所述的方法,其特征在于,所述将所述总向量输入确定子模块,利用所述确定子模块确定与所述待评估数据对应的期望,包括:将所述总向量输入压缩网络,得到压缩向量;根据所述压缩向量、与各高斯分布对应的预设参数,确定与所述待评估数据对应的期望;所述高斯分布的数量为所述特征域的数量;所述期望用于表征所述待评估数据与各所述高斯分布之间的距离。5.根据权利要求4所述的方法,其特征在于,所述将所述总向量输入压缩网络,得到压缩向量,包括:根据编码函数、第一神经网络参数,对所述总向量进行编码,得到编码向量;根据解码函数、第二神经网络参数,对所述编码向量进行解码,得到解码向量;根据所述待评估数据的特征、所述解码向量,确定重构误差;所述重构误差用于表征所述解码向量与所述待评估数据的特征之间的差异;根据所述编码向量、所述重构误差,确定所述压缩向量。6.根据权利要求1所述的方法,其特征在于,所述根据所述期望确定与所述待评估数据对应的风险评分,包括:根据预设映射函数,将所述待评估数据的所述期望映射为所述风险评分。
7.根据权利要求1

6任一项所述的方法,其特征在于,获取与所述业务活动对应的待评估数据,包括:获取与所述业务活动对应的离线特征,获取与业务活动对应的实时数据;根据所述离线特征、所述实时数据,确定所述业务活动的待评估数据。8.根据权利要求1

6任一项所述的方法,其特征在于,还包括:若所述风险评分大于阈值,则进行预警。9.一种用于评估业务活动风险的模型的训练方法,其特征在于,所述模型包括:与每个特征域对应的编码网络、注意力层、确定子模块;所述方法包括:获取与所述业务活动对应的多个样本数据;每一所述样本数据包括多个数据特征,每个所述数据特征对应于一个特征域;将每个样本数据中与同一特征域对应的所述数据特征,输入与所述特征域对应的编码网络,得到与所述特征域对应的特征向量;将与所述特征域对应的特征向量输入所述注意力层,得到与每个样本数据对应的包括各个所述特征向量之间关系的总向量;将每个样本数据的所述总向量输入所述确定子模块,利用所述确定子模块确定每个所述样本数据的期望,并根据每一样本数据的期望训练所述模型,得到用于评估业务活动风险的模型。10.根据权利要求9所述的方法,其特征在于,所述将与所述特征域对应的特征向量输入注意力层,得到与每个样本数据对应的包括各个所述特征向量之间关系的总向量,包括:根据每个样本数据中与各个特征域对应的所述特征向量,确定每个样本数据中每两个特征向量之间的特征相似度;根据每个样本数据中各个特征相似度,确定每个样本数据包括各个所述特征向量之间关系的总向量。11.根据权利要求10所述的方法,其特征在于,所述根据每个样本数据中每两个特征向量之间的特征相似度,确定每个样本数据包括各个所述特征向量之间关系的总向量,包括:根据每个样本数据的各个特征相似度,确定每个样本数据中每个特征向量与其他特征向量之间的关系系数;所述关系系数用于表征两个特征向量之间的关系;根据每个样本数据中每个特征向量与其他特征向量之间的关系系数、各个所述特征向量,确定每个样本数据中每个特征向量的特征域嵌入向量;根据每个样本数据中各特征向量的特征域嵌入向量,生成每个样本数据的总向量。12.根据权利要求9所述的方法,其特征在于,所述将每个样本数据的所述总向量输入确定子模块,利用所述确定子模块确定每个所述样本数据的期望,包括:将每个样本数据的所述总向量输入压缩网络,得到每个样本数据的压缩向量;将每个样本数据的所述压缩向量输入估计网络,得到所述每个样本数据属于各高斯分布的概率向量;其中,所述高斯分布的数量为所述特征域的数量;根据每个...

【专利技术属性】
技术研发人员:石亚庆林元晟柳婷王晓勤罗尚勇
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1