更新事件评估模型的方法及装置制造方法及图纸

技术编号:24499803 阅读:61 留言:0更新日期:2020-06-13 04:35
本说明书实施例提供一种事件评估模型的训练方法和装置。该事件评估模型包括宽度部分和深度部分,宽度部分模型参数少,用于处理事件的可解释性特征数据;深度部分模型参数多,用于处理与事件相关联的抽象特征数据。训练方法包括,收集较短时间周期中的样本事件,获取短期样本集;将短期样本集中的样本事件输入事件评估模型,根据预测结果和对应的类别标签,确定短期预测损失,根据该短期预测损失,更新宽度部分。收集较长时间周期中的样本事件,获取长期样本集,将其中各个样本事件输入事件评估模型,根据预测结果和对应的类别标签,确定长期预测损失;并根据该长期预测损失,更新深度部分。

Method and device of updating event evaluation model

【技术实现步骤摘要】
更新事件评估模型的方法及装置
本说明书一个或多个实施例涉及机器学习领域,尤其涉及利用机器学习预测业务实体的业务指标的方法和装置。
技术介绍
随着计算机技术的发展,机器学习已经应用到各种各样的
,用于分析、预测各种业务数据。在许多场景下,需要对与用户相关的交互事件进行分析和处理。交互事件是互联网事件的基本组成元素之一,例如,用户浏览各种网页中的各种区块,可以视为浏览事件;用户在某些页面上进行一系列操作,包括点击某个区块,键入某些字符,拖拽某些页面元素等等,可以视为操作事件;用户通过各种方式登录一个网站,一个App,或一个邮箱等行为,可以视为登录事件;用户利用电子支付平台将资金转给另一用户,在线支付给电商平台中的商家,或者当面二维码支付给线下商家,这些行为都可以视为交易事件。在许多情况下,希望能够对各种交互事件的安全性进行评估和分析,从而保障互联网平台的安全性。例如,评估和识别出不安全的登录事件,有助于预先发现和阻止黑客攻击,保障登录安全;评估和识别出不安全的交易事件,有助于锁定不安全的交易,例如涉嫌盗卡的交易,涉嫌欺诈的交易等等,保障用户资金安全。因此,希望能有改进的方案,更为有效地对交互事件的安全性进行分析和评估。
技术实现思路
本说明书一个或多个实施例描述了一种事件评估模型和更新该事件评估模型的方法和装置,其中采用宽度部分和深度部分相结合来实现事件评估模型,采用短周期和长周期相结合来更新该事件评估模型,从而提高对事件安全性分析的准确性和时效性。根据第一方面,提供了一种更新事件评估模型的方法,所述事件评估模型包括宽度部分和深度部分,所述宽度部分的模型参数少于所述深度部分,所述方法包括:通过收集第一时间周期中的样本事件,获取第一训练样本集,所述样本事件包括第一特征数据、第二特征数据和类别标签,所述第一特征数据至少包括,描述所述样本事件的基本属性特征的可解释性特征数据,第二特征数据包括,与所述样本事件相关联的、经过编码处理的特征数据;将第一训练样本集中的各个样本事件分别输入所述事件评估模型进行预测处理,并根据第一训练样本集中各个样本的预测结果和对应的类别标签,确定第一预测损失;其中所述预测处理包括,将各个样本事件的第一特征数据输入所述宽度部分,将第二特征数据输入所述深度部分,根据所述宽度部分和深度部分的计算结果,预测该样本事件的类别;固定所述深度部分,在使得第一预测损失减小的方向更新所述宽度部分;通过收集第二时间周期中的样本事件,获取第二训练样本集;所述第二时间周期大于第一时间周期;将第二训练样本集中的各个样本事件分别输入所述事件评估模型进行所述预测处理,并根据第二训练样本集中各个样本的预测结果和对应的类别标签,确定第二预测损失;固定所述宽度部分,在使得第二预测损失减小的方向更新所述深度部分。在不同实施例中,样本事件可以包括以下之一:操作事件、浏览事件、登录事件、交易事件。在各种实施例中,事件的基本属性特征包括以下中的至少一项:事件发生的时间,地点,参与方标识,参与方属性特征,事件基于的设备特征,与事件类型相关的事件特征。进一步的,在一个实施例中,第一特征数据还包括,对所述基本属性特征的原始数据进行统计而得到的统计数据。根据一个实施例,模型中的宽度部分实现为以下之一:多层感知机,树模型。在不同实施例中,第二特征数据和深度部分可以具有以下特点:第二特征数据可以包括样本事件的参与方行为序列数据,在这样的情况下,所述深度部分可以包括循环神经网络RNN或长短期记忆网络LSTM;和/或,所述第二特征数据包括,与样本事件相关的二维图表数据,在这样的情况下,所述深度部分包括卷积神经网络CNN;和/或,所述第二特征数据包括,与样本事件相关的参与方关系图数据,在这样的情况下,所述深度部分包括图神经网络GNN;和/或,所述第二特征数据包括,与样本事件相关的文本描述数据,在这样的情况下,所述深度部分包括文本卷积网络。根据一种实施方式,事件评估模型还包括全连接层;相应的,预测样本事件的类别具体包括:利用所述全连接层,对所述宽度部分输出的第一计算结果和深度部分输出的第二计算结果进行融合,根据融合结果,确定针对样本事件类别的预测结果。在一个实施例中,第一时间周期不大于10天;第二时间周期不小于1个月。根据第二方面,提供了一种更新事件评估模型的装置,所述事件评估模型包括宽度部分和深度部分,所述宽度部分的模型参数少于所述深度部分,所述装置包括:第一样本获取单元,配置为通过收集第一时间周期中的样本事件,获取第一训练样本集,所述样本事件包括第一特征数据、第二特征数据和类别标签,所述第一特征数据至少包括,描述所述样本事件的基本属性特征的可解释性特征数据,第二特征数据包括,与所述样本事件相关联的、经过编码处理的特征数据;第一预测单元,配置为将第一训练样本集中的各个样本事件分别输入所述事件评估模型进行预测处理,并根据第一训练样本集中各个样本的预测结果和对应的类别标签,确定第一预测损失;其中所述预测处理包括,将各个样本事件的第一特征数据输入所述宽度部分,将第二特征数据输入所述深度部分,根据所述宽度部分和深度部分的计算结果,预测该样本事件的类别;宽度更新单元,配置为固定所述深度部分,在使得第一预测损失减小的方向更新所述宽度部分;第二样本获取单元,配置为通过收集第二时间周期中的样本事件,获取第二训练样本集;所述第二时间周期大于第一时间周期;第二预测单元,配置为将第二训练样本集中的各个样本事件分别输入所述事件评估模型进行所述预测处理,并根据第二训练样本集中各个样本的预测结果和对应的类别标签,确定第二预测损失;深度更新单元,配置为固定所述宽度部分,在使得第二预测损失减小的方向更新所述深度部分。根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。根据本说明书实施例提供的方法和装置,针对事件安全性评估问题,设计了宽度部分和深度部分相结合的模型架构。基于这样的模型架构,采用短周期和长周期相结合的更新方式,分别对宽度部分和深度部分进行更新,兼顾了模型稳定性和攻防时效性,从而使得事件评估模型可以更好地应对事件风险评估中的新场景,获得更高的评估性能。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本说明书披露的一个实施例的实施场景示意图;图2示出根据一个实施例的事件评估模型的示意图;图3示出根据一个本文档来自技高网...

【技术保护点】
1.一种更新事件评估模型的方法,所述事件评估模型包括宽度部分和深度部分,所述宽度部分的模型参数少于所述深度部分,所述方法包括:/n通过收集第一时间周期中的样本事件,获取第一训练样本集,所述样本事件包括第一特征数据、第二特征数据和类别标签,所述第一特征数据至少包括,描述所述样本事件的基本属性特征的可解释性特征数据,第二特征数据包括,与所述样本事件相关联的、经过编码处理的特征数据;/n将第一训练样本集中的各个样本事件分别输入所述事件评估模型进行预测处理,并根据第一训练样本集中各个样本的预测结果和对应的类别标签,确定第一预测损失;其中所述预测处理包括,将各个样本事件的第一特征数据输入所述宽度部分,将第二特征数据输入所述深度部分,根据所述宽度部分和深度部分的计算结果,预测该样本事件的类别;/n固定所述深度部分,在使得第一预测损失减小的方向更新所述宽度部分;/n通过收集第二时间周期中的样本事件,获取第二训练样本集;所述第二时间周期大于第一时间周期;/n将第二训练样本集中的各个样本事件分别输入所述事件评估模型进行所述预测处理,并根据第二训练样本集中各个样本的预测结果和对应的类别标签,确定第二预测损失;/n固定所述宽度部分,在使得第二预测损失减小的方向更新所述深度部分。/n...

【技术特征摘要】
1.一种更新事件评估模型的方法,所述事件评估模型包括宽度部分和深度部分,所述宽度部分的模型参数少于所述深度部分,所述方法包括:
通过收集第一时间周期中的样本事件,获取第一训练样本集,所述样本事件包括第一特征数据、第二特征数据和类别标签,所述第一特征数据至少包括,描述所述样本事件的基本属性特征的可解释性特征数据,第二特征数据包括,与所述样本事件相关联的、经过编码处理的特征数据;
将第一训练样本集中的各个样本事件分别输入所述事件评估模型进行预测处理,并根据第一训练样本集中各个样本的预测结果和对应的类别标签,确定第一预测损失;其中所述预测处理包括,将各个样本事件的第一特征数据输入所述宽度部分,将第二特征数据输入所述深度部分,根据所述宽度部分和深度部分的计算结果,预测该样本事件的类别;
固定所述深度部分,在使得第一预测损失减小的方向更新所述宽度部分;
通过收集第二时间周期中的样本事件,获取第二训练样本集;所述第二时间周期大于第一时间周期;
将第二训练样本集中的各个样本事件分别输入所述事件评估模型进行所述预测处理,并根据第二训练样本集中各个样本的预测结果和对应的类别标签,确定第二预测损失;
固定所述宽度部分,在使得第二预测损失减小的方向更新所述深度部分。


2.根据权利要求1所述的方法,其中,所述样本事件包括以下之一:操作事件、浏览事件、登录事件、交易事件。


3.根据权利要求1或2所述的方法,其中,所述基本属性特征包括以下中的至少一项:事件发生的时间,地点,参与方标识,参与方属性特征,事件基于的设备特征,与事件类型相关的事件特征。


4.根据权利要求1或2所述的方法,其中,所述第一特征数据还包括,对所述基本属性特征的原始数据进行统计而得到的统计数据。


5.根据权利要求1所述的方法,其中,所述宽度部分实现为以下之一:多层感知机,树模型。


6.根据权利要求1所述的方法,其中,
所述第二特征数据包括,所述样本事件的参与方行为序列数据,所述深度部分包括循环神经网络RNN或长短期记忆网络LSTM;和/或,
所述第二特征数据包括,与样本事件相关的二维图表数据,所述深度部分包括卷积神经网络CNN;和/或,
所述第二特征数据包括,与样本事件相关的参与方关系图数据,所述深度部分包括图神经网络GNN;和/或,
所述第二特征数据包括,与样本事件相关的文本描述数据,所述深度部分包括文本卷积网络。


7.根据权利要求1所述的方法,其中,所述事件评估模型还包括全连接层;
所述根据所述宽度部分和深度部分的计算结果,预测该样本事件的类别,包括:利用所述全连接层,对所述宽度部分输出的第一计算结果和深度部分输出的第二计算结果进行融合,根据融合结果,确定针对样本事件类别的预测结果。


8.根据权利要求1所述的方法,其中,所述第一时间周期不大于10天;所述第二时间周期不小于1个月。


9.一种更新事件评估模型的装置,所述事件评估模型包括宽度部分和深度部分,所述宽度部分的模型参数少于所述深度部分,所述装置包括:
第一样本获取单元,配置为通过收集第一时间周期中的样本事件,获取第一训练...

【专利技术属性】
技术研发人员:张天翼郭龙宋孟楠王维强赵闻飙
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1