用于进行风险评估的神经网络系统、方法及装置制造方法及图纸

技术编号:26041169 阅读:101 留言:0更新日期:2020-10-23 21:20
本说明书实施例提供一种适用于在多方隐私保护下进行风险评估的神经网络系统、方法及装置。根据该方案,首先基于第一神经网络模型中的N个子模型分别获取用户的N个属性字段各自在约定的T个时刻的字段值序列;然后,采用时间递归的方式,分别将N个字段值序列处理为N个表征向量;上述N个子模型可部署于隔离的多方之中,且上述表征向量可保护原始字段值代表的隐私数据。最后,利用第二神经网络模型,基于注意力机制,对N个表征向量进行融合,基于融合结果确定与用户相关的风险评估结果。

【技术实现步骤摘要】
用于进行风险评估的神经网络系统、方法及装置
本说明书一个或多个实施例涉及人工智能和机器学习领域,尤其涉及利用神经网络系统进行风险评估的方法和装置。
技术介绍
随着计算机网络的快速发展,网络安全问题日益突出。存在多种高风险操作行为,例如盗取账户、流量攻击、欺诈交易等等,有可能威胁网络安全或用户信息安全。出于网络安全和风险防控的考虑,在许多场景下,需要对用户风险类型、用户操作行为或操作事件等进行分析和处理,评估与用户相关的风险程度,以便进行风险防控。为了评估与用户相关的风险度,可以基于与用户相关的某项操作行为本身的特征进行分析。进一步地,还可以更全面地考虑用户的行为序列。行为序列是用户在日常操作使用中产生的一系列点击、访问、购买等事件的发生过程,可表示为事件集合的时间序列,它蕴含了用户的细粒度习惯偏好等特点,便于更全面地分析用户的操作历史和操作模式。然而,不管是操作事件还是行为序列数据,目前在进行特征刻画时往往是基于对交易的属性冲突、变异等行为特征进行刻画。但这种方式在一定程度上容易造成风险的漏放,比如恶意使用者如果有意的避开行为的聚集,使得累计变量的聚集性描述作用降低,那么风险识别能力将大打折扣。此外,虽然可以从不同的风险模块来刻画不同种类风险,但是这些风险刻画标签往往依赖于在案件分析时发现的属性聚集,而这一部分往往比较偏人工分析。然而,可以理解,在人工分析阶段严重依赖于人工的业务经验和效率。当业务经验不够完善的时候,人工选取的特征很可能不够全面或不够具有代表性,使得基于特征的事件分析准确性不够高。并且,人工分析存在安全性泄露的风险。一旦选取特征的方式被泄露,恶意使用者就会采取相应的规避策略,有意避开选取的特征进行其他方式的攻击。因此,希望能有改进的方案,更为准确有效地对与用户相关的风险进行风险度分析,以便于进行风险防控。
技术实现思路
本说明书一个或多个实施例描述了用于进行风险评估的神经网络系统、方法及装置,可以感知不同时刻属性字段的变化,从属性字段的变化中预测风险,从而更准确地确定与用户相关的风险评估结果。根据第一方面,提供了一种适用于在多方隐私保护下进行风险评估的神经网络系统,包括:适用于多方分布式部署的第一神经网络模型和第二神经网络模型;所述第一神经网络模型包括对应于用户的N个属性字段的N个子模型,各个子模型用于,获取对应的属性字段在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,将所述字段值序列处理为表征向量;第二神经网络模型用于,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。在一个实施例中,所述N个属性字段包括以下中的多项:IP地址,设备类型,地理位置,支付渠道,支付卡号,支付卡的发卡行。在一个实施例中,所述T个时刻包括,当前时刻,以及当前时刻之前预定的T-1个历史时刻;所述风险评估结果示出,所述用户为高风险用户的评估概率。在一个实施例中,所述T个时刻包括,所述用户参与的当前事件的发生时刻,以及与该当前事件同类型的T-1个历史事件分别对应的T-1个历史时刻;所述风险评估结果示出,所述当前事件为高风险事件的评估概率。在一个实施例中,所述N个子模型包括任意的第一子模型,其对应于第一属性字段,该第一子模型包括:编码层,用于对所述第一属性字段在所述T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列;嵌入层,用于采用时间递归的方式,依次迭代处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量。根据一种实施方式,所述编码层具体用于:采用独热one-hot编码,分别将所述T个字段值编码为对应的编码向量;或者,分别对所述T个字段值进行词嵌入,得到对应的编码向量。根据一种实施方式,所述嵌入层包括长短期记忆LSTM或循环神经网络RNN。在一个实施例中,所述第二神经网络模型包括:注意力层,用于基于注意力机制,将所述N个表征向量进行融合,得到融合向量;输出层,用于至少根据所述融合向量,确定所述风险评估结果。根据一种实施方式,所述注意力层具体用于,利用权重分配因子,对所述N个表征向量进行加权组合,得到所述融合向量。在一个实施例中,所述N个子模型部署在多个不同的独立计算平台,所述第二神经网络模型部署在共享服务平台。根据第二方面,提供了一种适用于在多方隐私保护下通过神经网络系统进行风险评估的方法,所述神经网络系统包括,适用于多方分布式部署的第一神经网络模型和第二神经网络模型,所述第一神经网络模型包括N个子模型,所述方法包括:利用N个子模型,分别获取用户的N个属性字段各自在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,分别将对应的字段值序列处理为表征向量;利用所述第二神经网络模型,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。在一个实施例中,所述N个属性字段包括以下中的多项:IP地址,设备类型,地理位置,支付渠道,支付卡号,支付卡的发卡行。在一个实施例中,所述T个时刻包括,当前时刻,以及当前时刻之前预定的T-1个历史时刻;所述风险评估结果示出,所述用户为高风险用户的评估概率。在一个实施例中,所述T个时刻包括,所述用户参与的当前事件的发生时刻,以及与该当前事件同类型的T-1个历史事件分别对应的T-1个历史时刻;所述风险评估结果示出,所述当前事件为高风险事件的评估概率。在一个实施例中,所述采用时间递归的方式,分别将N个字段值序列处理为N个表征向量,包括:针对所述N个属性字段中任意的第一属性字段,对所述第一属性字段在所述T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列;采用时间递归的方式,依次迭代处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量。在一个实施例中,所述对所述第一属性字段在所述T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列,包括:采用独热one-hot编码,分别将所述T个字段值编码为对应的编码向量;或者,分别对所述T个字段值进行词嵌入,得到对应的编码向量。在一个实施例中,所述采用时间递归的方式,依次迭代处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量,包括:采用长短期记忆LSTM或循环神经网络RNN处理所述向量序列中各个向量,得到所述第一属性字段对应的表征向量。在一个实施例中,所述基于注意力机制,对N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果,包括:基于注意力机制,将所述N个表征向量进行融合,得到融合向量;至少根据所述融合向量,确定所述风险评估结果。在一个实施例中,所述基于注意力机制,将所述N个表征向量进行融合,得到融合向量,包括:利用权重分配因子,对所述N个表征向量进行加本文档来自技高网
...

【技术保护点】
1.一种适用于在多方隐私保护下进行风险评估的神经网络系统,包括:适用于多方分布式部署的第一神经网络模型和第二神经网络模型;/n所述第一神经网络模型包括对应于用户的N个属性字段的N个子模型,各个子模型用于,获取对应的属性字段在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,将所述字段值序列处理为表征向量;/n第二神经网络模型用于,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。/n

【技术特征摘要】
1.一种适用于在多方隐私保护下进行风险评估的神经网络系统,包括:适用于多方分布式部署的第一神经网络模型和第二神经网络模型;
所述第一神经网络模型包括对应于用户的N个属性字段的N个子模型,各个子模型用于,获取对应的属性字段在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,将所述字段值序列处理为表征向量;
第二神经网络模型用于,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。


2.根据权利要求1所述的系统,其中,所述N个属性字段包括以下中的多项:IP地址,设备类型,地理位置,支付渠道,支付卡号,支付卡的发卡行。


3.根据权利要求1所述的系统,其中,所述T个时刻包括,当前时刻,以及当前时刻之前预定的T-1个历史时刻;所述风险评估结果示出,所述用户为高风险用户的评估概率。


4.根据权利要求1所述的系统,其中,所述T个时刻包括,所述用户参与的当前事件的发生时刻,以及与该当前事件同类型的T-1个历史事件分别对应的T-1个历史时刻;所述风险评估结果示出,所述当前事件为高风险事件的评估概率。


5.根据权利要求1所述的系统,其中,所述N个子模型包括任意的第一子模型,其对应于第一属性字段,该第一子模型包括:
编码层,用于对所述第一属性字段在所述T个时刻的T个字段值分别进行编码,得到T个编码向量的向量序列;
嵌入层,用于采用时间递归的方式,依次迭代处理所述向量序列中各个编码向量,得到所述第一属性字段对应的表征向量。


6.根据权利要求5所述的系统,其中,所述编码层具体用于:
采用独热one-hot编码,分别将所述T个字段值编码为对应的编码向量;或者,
分别对所述T个字段值进行词嵌入,得到对应的编码向量。


7.根据权利要求5所述的系统,其中,所述嵌入层包括长短期记忆LSTM或循环神经网络RNN。


8.根据权利要求1所述的系统,其中,所述第二神经网络模型包括:
注意力层,用于基于注意力机制,将所述N个表征向量进行融合,得到融合向量;
输出层,用于至少根据所述融合向量,确定所述风险评估结果。


9.根据权利要求8所述的系统,其中,所述注意力层具体用于,利用权重分配因子,对所述N个表征向量进行加权组合,得到所述融合向量。


10.根据权利要求1-9任一项所述的系统,其中,所述N个子模型部署在多个不同的独立计算平台,所述第二神经网络模型部署在共享服务平台。


11.一种适用于在多方隐私保护下通过神经网络系统进行风险评估的方法,所述神经网络系统包括,适用于多方分布式部署的第一神经网络模型和第二神经网络模型,所述第一神经网络模型包括N个子模型,所述方法包括:
利用N个子模型,分别获取用户的N个属性字段各自在约定的T个时刻的T个字段值构成的字段值序列,采用时间递归的方式,分别将对应的字段值序列处理为表征向量;
利用所述第二神经网络模型,基于注意力机制,对所述N个子模型输出的N个表征向量进行融合,基于融合结果确定与所述用户相关的风险评估结果。


12.根据权利要求11所述的方法,其中,所述N个属性字段包括以下中的多项:IP地址,设备类型,地理位置,支付渠道,支付卡号,支付卡的发卡...

【专利技术属性】
技术研发人员:宋博文顾曦陈帅
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1