风险用户识别方法、装置、可读存储介质及终端设备制造方法及图纸

技术编号:21893644 阅读:94 留言:0更新日期:2019-08-17 15:11
本发明专利技术属于计算机技术领域,尤其涉及一种风险用户识别方法、装置、计算机可读存储介质及终端设备。所述方法获取待识别用户在预设的各个识别维度上的第一关联用户数以及第二关联用户数,所述第一关联用户数为与所述待识别用户对应的关联用户总数,所述第二关联用户数为与所述待识别用户对应的存在风险的关联用户总数;计算所述待识别用户在各个识别维度上的风险概率;根据各个识别维度上的风险概率构造所述待识别用户的风险概率向量;使用预设的识别模型对所述待识别用户的风险概率向量进行计算,得到所述待识别用户的识别结果。通过本发明专利技术实施例,充分考虑到用户关系网络中的特征信息,大大提高了识别结果的准确率。

Risk User Identification Method, Device, Readable Storage Media and Terminal Equipment

【技术实现步骤摘要】
风险用户识别方法、装置、可读存储介质及终端设备
本专利技术属于计算机
,尤其涉及一种风险用户识别方法、装置、计算机可读存储介质及终端设备。
技术介绍
现有技术中在进行风险用户识别时,采用的方式一般都是尽可能多的获取待识别用户的个人特征信息,并将这些个人特征信息输入到特定的算法模型中,经过一系列的计算过程从而得到识别结果。但是,在实际中,存在风险的用户往往不是孤立存在的,而是处于一个由众多的风险用户所构成的关系网络中,现有技术中未能充分考虑到这种用户关系网络中的特征信息,导致识别结果的准确率较低。
技术实现思路
有鉴于此,本专利技术实施例提供了一种风险用户识别方法、装置、计算机可读存储介质及终端设备,以解决现有的风险用户识别方法未能充分考虑到用户关系网络中的特征信息,识别结果的准确率较低的问题。本专利技术实施例的第一方面提供了一种风险用户识别方法,可以包括:获取待识别用户在预设的各个识别维度上的第一关联用户数以及第二关联用户数,所述第一关联用户数为与所述待识别用户对应的关联用户总数,所述第二关联用户数为与所述待识别用户对应的存在风险的关联用户总数;计算所述待识别用户在各个识别维度上的风险概率,其中,第dn个识别维度上的风险概率由第dn个识别维度上的所述第一关联用户数以及所述第二关联用户数计算得到,1≤dn≤DN,DN为识别维度的总数;根据各个识别维度上的风险概率构造所述待识别用户的风险概率向量;使用预设的识别模型对所述待识别用户的风险概率向量进行计算,得到所述待识别用户的识别结果,所述识别模型为经过预设的样本集合训练的机器学习模型。本专利技术实施例的第二方面提供了一种风险用户识别装置,可以包括:关联用户数获取模块,用于获取待识别用户在预设的各个识别维度上的第一关联用户数以及第二关联用户数,所述第一关联用户数为与所述待识别用户对应的关联用户总数,所述第二关联用户数为与所述待识别用户对应的存在风险的关联用户总数;风险概率计算模块,用于计算所述待识别用户在各个识别维度上的风险概率,其中,第dn个识别维度上的风险概率由第dn个识别维度上的所述第一关联用户数以及所述第二关联用户数计算得到,1≤dn≤DN,DN为识别维度的总数;风险概率向量构造模块,用于根据各个识别维度上的风险概率构造所述待识别用户的风险概率向量;用户识别模块,用于使用预设的识别模型对所述待识别用户的风险概率向量进行计算,得到所述待识别用户的识别结果,所述识别模型为经过预设的样本集合训练的机器学习模型。本专利技术实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如下步骤:获取待识别用户在预设的各个识别维度上的第一关联用户数以及第二关联用户数,所述第一关联用户数为与所述待识别用户对应的关联用户总数,所述第二关联用户数为与所述待识别用户对应的存在风险的关联用户总数;计算所述待识别用户在各个识别维度上的风险概率,其中,第dn个识别维度上的风险概率由第dn个识别维度上的所述第一关联用户数以及所述第二关联用户数计算得到,1≤dn≤DN,DN为识别维度的总数;根据各个识别维度上的风险概率构造所述待识别用户的风险概率向量;使用预设的识别模型对所述待识别用户的风险概率向量进行计算,得到所述待识别用户的识别结果,所述识别模型为经过预设的样本集合训练的机器学习模型。本专利技术实施例的第四方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:获取待识别用户在预设的各个识别维度上的第一关联用户数以及第二关联用户数,所述第一关联用户数为与所述待识别用户对应的关联用户总数,所述第二关联用户数为与所述待识别用户对应的存在风险的关联用户总数;计算所述待识别用户在各个识别维度上的风险概率,其中,第dn个识别维度上的风险概率由第dn个识别维度上的所述第一关联用户数以及所述第二关联用户数计算得到,1≤dn≤DN,DN为识别维度的总数;根据各个识别维度上的风险概率构造所述待识别用户的风险概率向量;使用预设的识别模型对所述待识别用户的风险概率向量进行计算,得到所述待识别用户的识别结果,所述识别模型为经过预设的样本集合训练的机器学习模型。本专利技术实施例与现有技术相比存在的有益效果是:本专利技术实施例首先获取待识别用户在预设的各个识别维度上的第一关联用户数以及第二关联用户数,其中,所述第一关联用户数为与所述待识别用户对应的关联用户总数,所述第二关联用户数为与所述待识别用户对应的存在风险的关联用户总数,然后据此计算所述待识别用户在各个识别维度上的风险概率,并根据各个识别维度上的风险概率构造所述待识别用户的风险概率向量,最后使用预设的识别模型对所述待识别用户的风险概率向量进行计算,得到所述待识别用户的识别结果。通过本专利技术实施例,充分考虑到用户关系网络中的特征信息,将待识别用户与其他用户之间的关联关系作为对该用户进行识别的依据,即并非仅从用户个体的角度进行分析,而是从群体关系的角度进行分析,从而大大提高了识别结果的准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1为本专利技术实施例中一种风险用户识别方法的一个实施例流程图;图2为对识别模型进行训练的示意流程图;图3为使用样本集合对识别模型进行训练的具体过程的示意流程图;图4为本专利技术实施例中一种风险用户识别装置的一个实施例结构图;图5为本专利技术实施例中一种终端设备的示意框图。具体实施方式为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。目前运行的风控系统中,利用常规规则对存在风险的用户进行识别,这种识别方案中没有充分利用用户关系网络中各个个体的关系,同时,必须要等到新增的用户在触发风控规则之后才能认定其为存在风险的用户,这存在一定的滞后性,同时也放过了新增用户在触发风控规则之前的风险。因此,本实施例提供了一种基于各个用户之间的关联关系,通过统计分析来识别新增用户是否存在风险的方法。请参阅图1,本专利技术实施例中一种风险用户识别方法的一个实施例可以包括:步骤S101、获取待识别用户在预设的各个识别维度上的第一关联用户数以及第二关联用户数。所述第一关联用户数为与所述待识别用户对应的关联用户总数,所述第二关联用户数为与所述待识别用户对应的存在风险的关联用户总数。本实施例中的识别维度包括但不限于:设备维度、IP维度以及业务员维度等等,若两个用户之间在某一识别维度上具有某种关系,则这两个用户即互为关联用户。例如:若两个用户使用过同一个终端设备登录过系统,则这两个用户在设备维度上互为关联用户;若两个用户使用过同一个IP地址登录过系统,则这两本文档来自技高网...

【技术保护点】
1.一种风险用户识别方法,其特征在于,包括:获取待识别用户在预设的各个识别维度上的第一关联用户数以及第二关联用户数,所述第一关联用户数为与所述待识别用户对应的关联用户总数,所述第二关联用户数为与所述待识别用户对应的存在风险的关联用户总数;计算所述待识别用户在各个识别维度上的风险概率,其中,第dn个识别维度上的风险概率由第dn个识别维度上的所述第一关联用户数以及所述第二关联用户数计算得到,1≤dn≤DN,DN为识别维度的总数;根据各个识别维度上的风险概率构造所述待识别用户的风险概率向量;使用预设的识别模型对所述待识别用户的风险概率向量进行计算,得到所述待识别用户的识别结果,所述识别模型为经过预设的样本集合训练的机器学习模型。

【技术特征摘要】
1.一种风险用户识别方法,其特征在于,包括:获取待识别用户在预设的各个识别维度上的第一关联用户数以及第二关联用户数,所述第一关联用户数为与所述待识别用户对应的关联用户总数,所述第二关联用户数为与所述待识别用户对应的存在风险的关联用户总数;计算所述待识别用户在各个识别维度上的风险概率,其中,第dn个识别维度上的风险概率由第dn个识别维度上的所述第一关联用户数以及所述第二关联用户数计算得到,1≤dn≤DN,DN为识别维度的总数;根据各个识别维度上的风险概率构造所述待识别用户的风险概率向量;使用预设的识别模型对所述待识别用户的风险概率向量进行计算,得到所述待识别用户的识别结果,所述识别模型为经过预设的样本集合训练的机器学习模型。2.根据权利要求1所述的风险用户识别方法,其特征在于,所述识别模型的构建过程包括:根据下式构建逻辑回归分析模型:LinResult=Wt1×FtVal1+Wt2×FtVal2+...+Wtdn×FtValdn+...+WtDN×FtValDN+C其中,(FtVal1,FtVal2,...,FtValdn,...,FtValDN)为用户的风险概率向量,FtValdn为用户在第dn个识别维度上的风险概率,(Wt1,Wt2,...,Wtdn,...,WtDN)为待求解的模型系数向量,Wtdn为第dn个识别维度上的权重系数,C为常数项,LinResult为所述逻辑回归分析模型的输出值;根据下式构建所述识别模型:其中,Sigmoid为S型生长曲线函数,RecResult为所述识别模型的输出值。3.根据权利要求2所述的风险用户识别方法,其特征在于,所述识别模型的训练过程包括:从预设的数据库中获取用户黑名单以及用户白名单,所述用户黑名单中记录了已识别出的存在风险的各个用户,所述用户白名单中记录了已识别出的不存在风险的各个用户;根据所述用户黑名单和所述用户白名单构造所述样本集合,其中,所述样本集合中的正样本集为根据所述用户黑名单构造而成,所述样本集合中的负样本集为根据所述用户白名单构造而成,所述样本集合中的任一样本均包括风险概率向量和识别结果;使用所述样本集合对所述识别模型进行训练,直至满足预设的收敛条件为止。4.根据权利要求3所述的风险用户识别方法,其特征在于,所述使用所述样本集合对所述识别模型进行训练包括:构造如下所示的样本矩阵:其中,sn为所述样本集合中的样本序号,1≤sn≤SN,SN为所述样本集合中的样本总数,SampleVecsn为第sn个样本的风险概率向量,且SampleVecsn=(SpEmsn,1,SpEmsn,2,...,SpEmsn,dn,...,SpEmsn,DN),SpEmsn,dn为第sn个样本的风险概率向量在第dn个识别维度上的风险概率,SpMatrix为所述样本矩阵;根据下式计算对所述识别模型进行第t次训练的误差向量:Errort=SpResultVec-Sigmoid(SpMatrix×WtVectT+C)其中,WtVect为第t次训练的模型系数向量,且WtVect=(Wtt,1,Wtt,2,...,Wtt,dn,...,Wtt,DN),Wtt,dn为第dn个识别维度上的权重系数在第t次训练中的取值,T为转置符号,SpResultVec为目标结果向量,且SpResultVec=(SpVal1,SpVal2,...,SpValsn,...,SpValSN)T,SpValsn为第sn个样本的识别结果,Errort为对所述识别模型进行第t次训练的误差向量,且Errort=(ErrEmt,1,ErrEmt,2,...,ErrEmt,sn,...,ErrEmt,SN)T,ErrEmt,sn为第sn个样本在第t次训练中的误差值;根据下式对所述模型系数向量进行迭代更新:其中,为预设的迭代步长;根据下式计算第t次训练的模型系数向量距离:其中,Dist为第t次训练的模型系数向量距离;若第t次训练的模型系数向量距离大于预设的距离阈值,则对所述识别模型进行第t+1次训练;若第t次训练的模型系数向量距离小于或等于所述距离阈值,则结束对所述识别模型的训练。5.根据权利要求1至4中任一项所述的风险用户识别方法,其特征在于,所述使用预设的识别模型对所述待识别用户的风险概率向量进行计算,得到所述待识别用户的识别结果包括:将...

【专利技术属性】
技术研发人员:毕文智谢波
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1