用户类别识别模型的训练方法和用户类别识别方法技术

技术编号:24353766 阅读:57 留言:0更新日期:2020-06-03 02:08
本说明书实施例公开了一种用户类别识别模型的训练方法和用户类别识别方法,训练方法包括:将样本用户的联系人列表输入用户类别计算模型,以生成样本用户属于预设类别的概率。将样本用户对应的软件特征,和样本用户属于预设类别的概率,输入用户类别识别模型,以生成样本用户的识别结果。根据样本用户的识别结果和样本用户的类别标签,对用户类别识别模型中的参数,以及样本用户的常用软件列表中每个常用软件对应的软件特征进行优化。当满足预设条件时,完成对用户类别识别模型的训练。由此,使得训练完的用户类别识别模型能够在用户信息不充分的情况下,基于待识别用户的联系人列表和对应的软件特征,实现用户类别识别。

Training method and user category recognition method of user category recognition model

【技术实现步骤摘要】
用户类别识别模型的训练方法和用户类别识别方法
本说明书涉及数据处理
,尤其涉及一种用户类别识别模型的训练方法和用户类别识别方法。
技术介绍
随着移动互联网技术的发展,在手机等移动终端上运行的移动应用,极大地方便了人们的生活。由于移动终端的用户基本保持不变,因此可以对移动应用进行个性化设置,使得移动应用满足用户的个性化需求。为了让移动应用能够满足用户的个性化需求,需要先确定用户的类别,再根据用户的类别进行相应的设置。但是对于新用户来说,移动应用无法获取用户的历史信息,使得用于分析用户类别的信息不充分,不能确定用户的类别。相关技术中,通过获取用户的联系人信息,来分析该用户的社会关系,进而确定用户的类别,准确度不高。因此,亟需一种能够在用户信息不充分的情况下,对用户类别进行准确识别的技术方案。
技术实现思路
本说明书实施例旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本说明书实施例的第一个目的在于提出一种用户类别识别模型的训练方法,使得训练完的用户类别识别模型能够在用户信息不充分的情况下,基于待识别用户的联系人列表和对应的软件特征,实现用户类别识别。本说明书实施例的第二个目的在于提出一种用户类别识别方法。本说明书实施例的第三个目的在于提出一种用户类别识别模型的训练装置。本说明书实施例的第四个目的在于提出一种用户类别识别装置。本说明书实施例的第五个目的在于提出一种计算机设备。本说明书实施例的第六个目的在于提出一种计算机设备。本说明书实施例的第七个目的在于提出一种非临时性计算机可读存储介质。本说明书实施例的第八个目的在于提出一种非临时性计算机可读存储介质。为达上述目的,本说明书实施例第一方面实施例提出了一种用户类别识别模型的训练方法,包括:获取样本用户的常用软件列表和联系人列表,以及类别标签;获取所述样本用户的常用软件列表中每个常用软件对应的软件特征;将所述样本用户的联系人列表输入所述用户类别计算模型,以生成所述样本用户属于预设类别的概率;将所述样本用户对应的软件特征,和所述样本用户属于预设类别的概率,输入用户类别识别模型,以生成所述样本用户的识别结果;其中,所述用户类别识别模型包括图神经网络和注意力神经网络;根据所述样本用户的识别结果和所述样本用户的类别标签,对所述用户类别识别模型中的参数,以及所述样本用户的常用软件列表中每个常用软件对应的软件特征进行优化;以及当满足预设条件时,完成对所述用户类别识别模型的训练。和现有技术相比,本说明书实施例基于待识别用户的联系人列表和对应的软件特征,来对用户类别进行识别,能够在用户信息不充分的情况下,实现对待识别用户类别的准确识别。另外,本说明书实施例的用户类别识别模型的训练方法,还具有如下附加的技术特征:可选地,所述将所述样本用户对应的软件特征,和所述样本用户属于预设类别的概率,输入所述用户类别识别模型,以生成所述样本用户的识别结果,包括:将所述样本用户对应的软件特征输入所述注意力神经网络;其中,所述注意力神经网络用于确定所述常用软件列表中每个常用软件的影响度;基于所述样本用户对应的软件特征,和所述常用软件列表中每个常用软件的影响度,确定所述样本用户的用户特征;根据所述样本用户的用户特征,以及所述样本用户属于预设类别的概率,生成所述样本用户的识别结果。可选地,所述根据所述样本用户的识别结果和所述样本用户的类别标签,对所述用户类别识别模型中的参数,以及所述样本用户的常用软件列表中每个常用软件对应的软件特征进行优化,包括:根据所述样本用户的类别标签和所述样本用户属于预设类别的概率,生成所述用户类别计算模型的计算误差;根据所述样本用户的类别标签和所述样本用户的识别结果,生成所述用户类别识别模型的识别误差;基于所述用户类别计算模型的计算误差,对所述用户类别识别模型的识别误差进行加权处理;根据加权处理后的所述识别误差,对所述用户类别识别模型中的参数,以及所述样本用户的常用软件列表中每个常用软件对应的软件特征进行优化。可选地,所述将所述样本用户的联系人列表输入所述用户类别计算模型,以生成所述样本用户属于预设类别的概率,包括:根据全部所述样本用户的联系人列表,生成所述样本用户的关系网络;其中,所述关系网络包括多个节点,每个所述节点与所述样本用户相对应;对所述样本用户的关系网络进行无监督学习处理,以确定每个所述样本用户对应的所述图节点的图特征;将所述样本用户对应的所述图节点的图特征输入分类器,以生成所述样本用户属于预设类别的概率。可选地,所述用户类别计算模型为逾期风险计算模型,所述逾期风险计算模型通过所述联系人列表,计算所述样本用户为逾期用户的概率,所述用户类别识别模型为逾期风险预测模型,所述逾期风险预测模型通过所述软件特征和所述样本用户为逾期用户的概率,确定所述样本用户的逾期风险。本说明书实施例第二方面实施例提出了一种用户类别识别方法,包括:获取待识别用户的常用软件列表和联系人列表;获取所述待识别用户的常用软件列表中每个常用软件对应的软件特征;将所述待识别用户的联系人列表输入用户类别计算模型,以生成所述待识别用户属于预设类别的概率;将所述待识别用户对应的软件特征,和所述待识别用户属于预设类别的概率,输入如前述训练方法训练完的用户类别识别模型中;以及根据所述用户类别识别模型的输出,对所述待识别用户进行识别。另外,本说明书实施例的用户类别识别方法,还具有如下附加的技术特征:可选地,所述用户类别计算模型为逾期风险计算模型,所述逾期风险计算模型通过所述联系人列表,计算所述待识别用户为逾期用户的概率,所述用户类别识别模型为逾期风险预测模型,所述逾期风险预测模型通过所述软件特征和所述待识别用户为逾期用户的概率,确定所述待识别用户的逾期风险。本说明书实施例第三方面实施例提出了一种用户类别识别模型的训练装置,包括:第一获取模块,用于获取样本用户的常用软件列表和联系人列表,以及类别标签;第二获取模块,用于获取所述样本用户的常用软件列表中每个常用软件对应的软件特征;第一输入模块,用于将所述样本用户的联系人列表输入所述用户类别计算模型,以生成所述样本用户属于预设类别的概率;第二输入模块,用于将所述样本用户对应的软件特征,和所述样本用户属于预设类别的概率,输入用户类别识别模型,以生成所述样本用户的识别结果;其中,所述用户类别识别模型包括图神经网络和注意力神经网络;优化模块,用于根据所述样本用户的识别结果和所述样本用户的类别标签,对所述用户类别识别模型中的参数,以及所述样本用户的常用软件列表中每个常用软件对应的软件特征进行优化;以及训练模块,用于当满足预设条件时,完成对所述用户类别识别模型的训练。另外,本说明书实施例的用户类别识别模型的训练装置,还具有如下附加的技术特征:可选地,所述第二输入模块,包括:第一输入子模块,用于将所述样本用户对应的软件特征输入所述注意力神经网络;其中,所述注意力神经网络用于确定所述常用软件列表中本文档来自技高网...

【技术保护点】
1.一种用户类别识别模型的训练方法,包括:/n获取样本用户的常用软件列表和联系人列表,以及类别标签;/n获取所述样本用户的常用软件列表中每个常用软件对应的软件特征;/n将所述样本用户的联系人列表输入所述用户类别计算模型,以生成所述样本用户属于预设类别的概率;/n将所述样本用户对应的软件特征,和所述样本用户属于预设类别的概率,输入用户类别识别模型,以生成所述样本用户的识别结果;其中,所述用户类别识别模型包括图神经网络和注意力神经网络;/n根据所述样本用户的识别结果和所述样本用户的类别标签,对所述用户类别识别模型中的参数,以及所述样本用户的常用软件列表中每个常用软件对应的软件特征进行优化;以及/n当满足预设条件时,完成对所述用户类别识别模型的训练。/n

【技术特征摘要】
1.一种用户类别识别模型的训练方法,包括:
获取样本用户的常用软件列表和联系人列表,以及类别标签;
获取所述样本用户的常用软件列表中每个常用软件对应的软件特征;
将所述样本用户的联系人列表输入所述用户类别计算模型,以生成所述样本用户属于预设类别的概率;
将所述样本用户对应的软件特征,和所述样本用户属于预设类别的概率,输入用户类别识别模型,以生成所述样本用户的识别结果;其中,所述用户类别识别模型包括图神经网络和注意力神经网络;
根据所述样本用户的识别结果和所述样本用户的类别标签,对所述用户类别识别模型中的参数,以及所述样本用户的常用软件列表中每个常用软件对应的软件特征进行优化;以及
当满足预设条件时,完成对所述用户类别识别模型的训练。


2.如权利要求1所述的方法,其中,所述将所述样本用户对应的软件特征,和所述样本用户属于预设类别的概率,输入所述用户类别识别模型,以生成所述样本用户的识别结果,包括:
将所述样本用户对应的软件特征输入所述注意力神经网络;其中,所述注意力神经网络用于确定所述常用软件列表中每个常用软件的影响度;
基于所述样本用户对应的软件特征,和所述常用软件列表中每个常用软件的影响度,确定所述样本用户的用户特征;
根据所述样本用户的用户特征,以及所述样本用户属于预设类别的概率,生成所述样本用户的识别结果。


3.如权利要求2所述的方法,其中,所述根据所述样本用户的识别结果和所述样本用户的类别标签,对所述用户类别识别模型中的参数,以及所述样本用户的常用软件列表中每个常用软件对应的软件特征进行优化,包括:
根据所述样本用户的类别标签和所述样本用户属于预设类别的概率,生成所述用户类别计算模型的计算误差;
根据所述样本用户的类别标签和所述样本用户的识别结果,生成所述用户类别识别模型的识别误差;
基于所述用户类别计算模型的计算误差,对所述用户类别识别模型的识别误差进行加权处理;
根据加权处理后的所述识别误差,对所述用户类别识别模型中的参数,以及所述样本用户的常用软件列表中每个常用软件对应的软件特征进行优化。


4.如权利要求1所述的方法,其中,所述将所述样本用户的联系人列表输入所述用户类别计算模型,以生成所述样本用户属于预设类别的概率,包括:
根据全部所述样本用户的联系人列表,生成所述样本用户的关系网络;其中,所述关系网络包括多个节点,每个所述节点与所述样本用户相对应;
对所述样本用户的关系网络进行无监督学习处理,以确定每个所述样本用户对应的所述图节点的图特征;
将所述样本用户对应的所述图节点的图特征输入分类器,以生成所述样本用户属于预设类别的概率。


5.如权利要求1-4中任一项所述的方法,其中,所述用户类别计算模型为逾期风险计算模型,所述逾期风险计算模型通过所述联系人列表,计算所述样本用户为逾期用户的概率,所述用户类别识别模型为逾期风险预测模型,所述逾期风险预测模型通过所述软件特征和所述样本用户为逾期用户的概率,确定所述样本用户的逾期风险。


6.一种用户类别识别方法,包括:
获取待识别用户的常用软件列表和联系人列表;
获取所述待识别用户的常用软件列表中每个常用软件对应的软件特征;
将所述待识别用户的联系人列表输入用户类别计算模型,以生成所述待识别用户属于预设类别的概率;
将所述待识别用户对应的软件特征,和所述待识别用户属于预设类别的概率,输入如权利要求1-4中任一种训练方法训练完的用户类别识别模型中;以及
根据所述用户类别识别模型的输出,对所述待识别用户进行识别。


7.如权利要求6所述的方法,其中,所述用户类别计算模型为逾期风险计算模型,所述逾期风险计算模型通过所述联系人列表,计算所述待识别用户为逾期用户的概率,所述用户类别识别模型为逾期风险预测模型,所述逾期风险预测模型通过所述软件特征和所述待识别用户为逾期用户的概率,确定所述待识别用户的逾期风险。


8.一种用户类别识别模型的训练装置,包括:
第一获取模块,用于获取样本用户的常用软件列表和联系人列表,以及类别标签;
第二获取模块,用于获取所述样本用户的常用软件列表中每个常用软件对应的软件特征;
第一输入模块,用于将所述样本用户的联系人列表输入所述用户类别计算模型,以生成所述样本用户属于预设类别的概率;
第二输入模块,用于将所述样本用户对应的软件特征,和所...

【专利技术属性】
技术研发人员:王岱鑫李茜茜方精丽张志强贾全慧周俊方彦明
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1