可信性判别的方法及系统技术方案

技术编号:35473812 阅读:20 留言:0更新日期:2022-11-05 16:21
本说明书实施例提供了一种可信性判别的方法及系统。其中方法包括:获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量;针对所述第一主体确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体,并将确定出的各第二主体分别与第一主体构成候选关系对;对各候选关系对进行风险评分,选择风险评分满足预设第二条件的候选关系对作为可信关系对,所述可信关系对用以在时间t2+m对包含网络行为的流量进行可信性判别。本申请能够实现基于双主体的准确可信性判别。申请能够实现基于双主体的准确可信性判别。申请能够实现基于双主体的准确可信性判别。

【技术实现步骤摘要】
可信性判别的方法及系统


[0001]本说明书一个或多个实施例涉及人工智能
,尤其涉及一种可信性判别的方法及系统。

技术介绍

[0002]在互联网技术日益发展的今天,用户在使用互联网的各种行为中出现各种风险。例如可能存在诸如网络交易诈骗、虚假兼职诈骗、网络交友诈骗等各种各样的欺诈形式。还可能存在诸如洗钱、作弊、赌博、盗用等风险形式。通常在风险识别系统的前端,对流量会首先进行可信性判别,将认为是可信用户行为的流量进行快速放行,而对于非可信用户行为的流量则送入风险识别系统进行更精细化的风险识别。一般而言,可信性判别可以放行9成以上的流量,仅1成左右的流量转至风险识别系统进行更精细化的识别。
[0003]为了减轻线上计算的压力,可信性判别大多采用了离线模型的设计思路,即采用离线的形式预先归纳出可信要素,然后线上进行可信性判别时,直接放行与可信要素匹配的流量。其中可信要素主要包括单主体和双主体。单主体是一个主体,例如针对一个用户进行的可信性判别。双主体是两个主体构成的关系对,例如消费者与商户之间、账户与收益卡之间、账户与设备之间,等等。鉴于在全域可信性判定中,行为关系的被动方发挥了重要的作用,双主体要素可以有效地覆盖不同的风险域,因此亟需一种能够基于双主体进行准确地可信性判别的方式。

技术实现思路

[0004]有鉴于此,本说明书一个或多个实施例公开了一种可信性判别的方法及系统,以便于实现基于双主体的准确可信性判别。
[0005]根据第一方面,本公开提供了一种可信性判别的方法,该方法包括:<br/>[0006]获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量;
[0007]针对所述第一主体,确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体,并将确定出的各第二主体分别与该第一主体构成候选关系对;
[0008]对各候选关系对进行风险评分,选择风险评分满足预设第二条件的候选关系对作为可信关系对,所述可信关系对用以在时间t2+m对包含网络行为的流量进行可信性判别;
[0009]其中,所述表征模型是预先利用训练数据进行对比学习得到的,所述训练数据包括正样本对和负样本对中各主体在时间t1之前预设时长内的行为特征,所述正样本对包括在时间t1+m发生预设类型的行为关系的第一主体和第二主体,所述负样本对包括在时间t1+m未发生预设类型的行为关系的第一主体和第二主体,所述t1为所述t2之前的历史时间,所述m为预设的正整数。
[0010]根据本申请实施例中一可实现的方式,所述表征模型采用如下方式预先训练得到:
[0011]获取所述训练数据;
[0012]利用所述训练数据训练动量对比度MoCo模型,训练目标包括:最大化负样本对中第一主体和第二主体之间的表征向量相似度且最小化正样本对中第一主体和第二主体之间的表征向量相似度;
[0013]利用训练得到的MoCo模型中的编码器得到所述表征模型。
[0014]根据本申请实施例中一可实现的方式,所述MoCo模型中的编码器包括第一编码器和第二编码器;
[0015]在所述训练中,所述第一编码器用以利用第一主体在时间t1之前预设时长内的行为特征,得到第一主体的向量表示;所述第二编码器用以利用第二主体在时间t1之前预设时长内的行为特征,得到第二主体的向量表示;在所述训练的每一轮迭代中利用训练损失的取值反向更新所述第一编码器的参数,所述第二编码器的参数根据所述第一编码器的参数进行动量更新;
[0016]所述利用训练得到的MoCo模型中的编码器得到所述表征模型包括:将训练得到的所述第一编码器作为所述表征模型。
[0017]根据本申请实施例中一可实现的方式,预先得到的所述表征模型被下发至所述第一主体的终端设备和所述第二主体的终端设备;
[0018]所述获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量包括:
[0019]从第一主体的终端设备获取表征模型利用该第一主体在时间t2之前预设时长内的行为特征得到的第一主体的表征向量;以及从从第二主体的终端设备获取表征模型利用该第二主体在时间t2之前预设时长内的行为特征得到的第二主体的表征向量。
[0020]根据本申请实施例中一可实现的方式,针对所述第一主体,确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体包括:
[0021]利用分层可导航小世界图HNSW方法,搜索表征向量与第一主体的表征向量之间最近的N个第二主体,所述N为预设的正整数。
[0022]根据本申请实施例中一可实现的方式,对各候选关系对进行风险评分,选择风险评分满足预设第二条件的候选关系对作为可信关系对包括:
[0023]对各候选关系对进行风险评分,得到候选关系对在M个风险类别上的评分,所述M为正整数;
[0024]选择在所述M个风险类别上的评分满足所述第二条件的候选关系对作为可信关系对。
[0025]根据本申请实施例中一可实现的方式,所述对各候选关系对进行风险评分包括:
[0026]利用风险评分模型对各候选关系对进行风险评分,其中所述风险评分模型是基于多任务专家模型预先训练得到的。
[0027]根据本申请实施例中一可实现的方式,所述风险评分模型包括:表征处理模块和k个专家模块;
[0028]所述表征处理模块对输入的候选关系对中第一主体和第二主体的特征向量进行拼接处理后,将得到的特征向量进行n阶表征交叉,所述n为正整数;
[0029]所述专家模块利用所述n阶表征交叉后得到的表征向量,映射得到该候选关系对
在各风险类别上的评分。
[0030]根据本申请实施例中一可实现的方式,该方法还包括:
[0031]若在所述时间t2+m接收到包含网络行为的流量,则将所述网络行为与所述可信关系对进行匹配,若依据匹配结果确定所述网络行为为可信行为,正常转发所述流量。
[0032]根据本申请实施例中一可实现的方式,所述第一主体为消费者,所述第二主体为商户,所述预设类型的行为关系包括交易行为、支付行为、收款行为和评价行为中的至少一种;或者,
[0033]所述第一主体和第二主体均为用户,所述预设类型的行为关系包括支付行为、存取款行为、签约绑定行为和收发红包行为中的至少一种。
[0034]第二方面,提供了一种可信性判别的系统,该系统包括:
[0035]表征获取单元,被配置为获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量;
[0036]候选召回单元,被配置为针对所述第一主体确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体,并将确定出的各第二主体分别与第一主体构成候选关系对;
[0037]风险评分单元,被配置为对各候选关系对进行风险评分;
[0038]关系对确定单元,被配置为选本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可信性判别的方法,其特征在于,该方法包括:获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量;针对所述第一主体,确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体,并将确定出的各第二主体分别与该第一主体构成候选关系对;对各候选关系对进行风险评分,选择风险评分满足预设第二条件的候选关系对作为可信关系对,所述可信关系对用以在时间t2+m对包含网络行为的流量进行可信性判别;其中,所述表征模型是预先利用训练数据进行对比学习得到的,所述训练数据包括正样本对和负样本对中各主体在时间t1之前预设时长内的行为特征,所述正样本对包括在时间t1+m发生预设类型的行为关系的第一主体和第二主体,所述负样本对包括在时间t1+m未发生预设类型的行为关系的第一主体和第二主体,所述t1为所述t2之前的历史时间,所述m为预设的正整数。2.根据权利要求1所述的方法,其特征在于,所述表征模型采用如下方式预先训练得到:获取所述训练数据;利用所述训练数据训练动量对比度MoCo模型,训练目标包括:最大化负样本对中第一主体和第二主体之间的表征向量相似度且最小化正样本对中第一主体和第二主体之间的表征向量相似度;利用训练得到的MoCo模型中的编码器得到所述表征模型。3.根据权利要求2所述的方法,其特征在于,所述MoCo模型中的编码器包括第一编码器和第二编码器;在所述训练中,所述第一编码器用以利用第一主体在时间t1之前预设时长内的行为特征,得到第一主体的向量表示;所述第二编码器用以利用第二主体在时间t1之前预设时长内的行为特征,得到第二主体的向量表示;在所述训练的每一轮迭代中利用训练损失的取值反向更新所述第一编码器的参数,所述第二编码器的参数根据所述第一编码器的参数进行动量更新;所述利用训练得到的MoCo模型中的编码器得到所述表征模型包括:将训练得到的所述第一编码器作为所述表征模型。4.根据权利要求1至3中任一项所述的方法,其特征在于,预先得到的所述表征模型被下发至所述第一主体的终端设备和所述第二主体的终端设备;所述获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量包括:从第一主体的终端设备获取表征模型利用该第一主体在时间t2之前预设时长内的行为特征得到的第一主体的表征向量;以及从从第二主体的终端设备获取表征模型利用该第二主体在时间t2之前预设时长内的行为特征得到的第二主体的表征向量。5.根据权利要求1所述的方法,其特征在于,针对所述第一主体,确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体包括:利用分层可导航小世界图HNSW方法,搜索表征向量与第一主体的表征向量之间最近的N个第二主体,所述N为预设的正整数。
6.根据权利要求1所述的方法,其特征在于,对各候选关系对进行风...

【专利技术属性】
技术研发人员:周璟蒋晨之王宁涛吕乐傅幸刘芳卿杨阳杨信王维强
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1