信息识别方法、模型训练方法、装置及处理设备制造方法及图纸

技术编号:15725180 阅读:253 留言:0更新日期:2017-06-29 12:58
本申请公开了一种信息识别方法、模型训练方法、装置及处理设备,从检测用户的行为数据中提取所述检测用户的关键特征;其中,所述关键特征由表示身份信息的特征数据组成;根据所述检测用户的好友用户是否为目标身份信息的检测结果,获得所述检测用户的社交特征;根据所述检测用户的用户特征,利用第一分类模型获得所述检测用户的好友用户是否为所述目标身份信息的检测结果;其中,所述好友用户的用户特征包括所述好友用户的关键特征;所述第一分类模型预先根据训练用户的用户特征训练获得,本申请实施例提高了识别准确度。

【技术实现步骤摘要】
信息识别方法、模型训练方法、装置及处理设备
本申请涉及计算机
,尤其涉及一种信息识别方法、模型训练方法、装置及处理设备。
技术介绍
随着计算技术以及互联网技术的发展,网络中产生的用户数据也越来越多,特别是用户身份信息,例如用户学历、用户职位等,而用户身份在实际应用中具有重要意义,比如在互联网金融中,根据用户学历可以对用户账户进行风险评级、征信评分等。现有技术中,用户身份的识别通常是根据用户提供的信息确定,例如用户学历信息,通常是根据用户自己填写的信息确定的,但是这种方式并没有对用户提供的信息进行鉴别,无法保证信息准确性,因此可能导致识别结果不准确。
技术实现思路
有鉴于此,本申请提供一种信息识别方法、用于信息识别的模型训练方法、装置及处理设备,用以解决现有技术中用户身份识别不准确的技术问题。本申请实施例提供一种信息识别方法,包括:从检测用户的行为数据中提取所述检测用户的关键特征;其中,所述关键特征由表示身份信息的特征数据组成;根据所述检测用户的好友用户是否为目标身份信息的检测结果,获得所述检测用户的社交特征;根据所述检测用户的用户特征,利用第一分类模型获得所述检测用户的好友用户是否为所述目标身份信息的检测结果;其中,所述好友用户的用户特征包括所述好友用户的关键特征;所述第一分类模型预先根据训练用户的用户特征训练获得。优选地,所述根据所述检测用户的好友用户是否为所述目标身份信息的检测结果,获得所述检测用户的社交特征之前,所述方法还包括:从所述检测用户的好友用户的行为数据中提取所述好友用户的关键特征;其中,所述关键特征由表示身份信息的特征数据组成;根据所述检测用户的好友用户的用户特征,利用第二分类模型获得所述检测用户的好友用户是否为所述目标身份信息的检测结果;其中,所述好友用户的用户特征包括所述好友用户的关键特征。优选地,所述第二分类模型预先根据从训练用户的行为数据中提取的所述训练用户的关键特征训练获得;所述第一分类模型预先根据所述训练用户的关键特征以及社交特征训练获得;所述训练用户的社交特征根据所述训练用户的好友用户的检测结果获得;所述好友用户的检测结果根据所述好友用户的关键特征利用所述第二分类模型获得。优选地,所述检测用户的好友用户的用户特征还包括所述检测用户的好友用户的社交特征;所述从所述检测用户的好友用户的行为数据中,提取所述检测用户的好友用户的关键特征包括:从所述检测用户的每一级迭代用户的行为数据中提取每一级迭代用户的关键特征;其中,所述检测用户的好友用户为所述检测用户的第1级迭代用户;,所述检测用户的第m级迭代用户分别与第m-1级迭代用户以及第m+1级迭代用户具有好友关系;m=1、2、…N,N为迭代训练次数且为大于等于1的整数;所述第二分类模型为第N级迭代分类模型;所述第一分类模型为第N+1级迭代分类模型;其中,第i级迭代用户的社交特征根据第i+1级迭代用户的检测结果获得,i=1、2…N-2;所述第i+1级迭代用户的检测结果按照如下方式获得:根据所述检测用户的第i+1级迭代用户的用户特征,利用第N-i级迭代分类模型,计算获得第i+1级迭代用户的检测结果;所述检测用户的第i+1级迭代用户的用户特征包括第i+1级迭代用户的关键特征以及社交特征;其中,第N级迭代用户的检测结果根据第N级迭代好友的关键特征利用第1级迭代分类模型计算获得;第N-1级迭代用户的社交特征根据第N级迭代用户的检测结果获得;所述第1级迭代分类模型预先根据从训练用户的行为数据中提取的所述训练用户的关键特征训练获得;所述第j+1级迭代分类模型基于所述第1级迭代分类模型进行迭代训练获得。优选地,所述第j+1级迭代分类模型按照如下迭代训练方式预先训练获得,其中,j=1、2、3……N;将训练用户的第j级迭代用户的关键特征,输入第1级迭代分类模型,计算获得第j级迭代用户的第1级检测结果;根据所述训练用户第j级迭代用户的第1级检测结果,获得第j-1级迭代用户的第1级社交特征;对于所述训练用户第j-i级迭代用户,将第j-i级迭代用户的第i级用户特征输入第i+1级迭代分类模型,计算获得第j-i级迭代用户的第i+1级检测结果;i=1、2、3……N-2;所述第i级用户特征包括关键特征以及第i级社交特征;根据所述第j-i级迭代用户的第i+1级检测结果,获得第j-i-1级迭代用户的第i+1级社交特征;将获得的第1级迭代用户的第j-1级用户特征输入第j级迭代模型,计算获得所述第1级迭代用户的第j级检测结果;所述第j-1级用户特征包括关键特征以及第j-1级社交特征;利用所述第1级迭代好友的第j级检测结果,计算获得训练用户的第j级社交特征;利用所述训练用户的第j级用户特征,训练获得第j+1级迭代分类模型;所述训练用户的第j级用户特征包括所述训练用户的关键特征及第j级社交特征。优选地,所述好友用户的检测结果为所述好友用户为所述目标身份信息的检测概率;所述根据所述好友用户的检测结果,获得所述检测用户的社交特征包括:根据每一个好友用户的检测概率计算平均检测概率,将所述平均检测概率作为所述检测用户的社交特征。优选地,所述目标身份信息为目标学历信息;所述从检测用户的行为数据中,提取所述检测用户的表示身份信息的关键特征包括:从检测用户的行为数据中,提取至少由学历等级关键词、不同学历等级关键词出现次数以及所述学历等级关键词出现次数的归一化次数构成的关键特征。一种用于信息识别的模型训练方法,包括:从训练用户的行为数据中,提取所述训练用户的关键特征,其中,所述关键特征由表示身份信息的特征数据组成;根据所述训练用户的好友用户是否为目标身份信息的检测结果,获得所述训练用户的社交特征;利用所述训练用户的用户特征,训练获得第一分类模型;所述训练用户的用户特征包括所述训练用户的关键特征以及社交特征;所述第一分类模型用于根据检测用户的用户特征,识别所述检测用户的身份信息。优选地,所述根据所述训练用户的好友用户是否为目标身份信息的检测结果,获得所述训练用户的社交特征之前,所述方法还包括:从训练用户的好友用户的行为数据中,提取训练用户的好友用户的关键特征;利用所述训练用户的关键特征,训练获得第二分类模型;将所述训练用户的好友用户的关键特征,输入第二分类模型,获得所述训练用户的好友用户是否为目标身份信息的检测结果。优选地,所述从训练用户的行为数据中,提取所述训练用户的关键特征之后,所述方法还包括:从所述训练用户的每一级迭代用户的行为数据中,提取所述每一级迭代用户的关键特征;其中,所述训练用户的好友用户为所述训练用户的第1级迭代用户;所述训练用户的第m级迭代用户分别与第m-1级迭代用户以及第m+1级迭代用户具有好友关系;m=1、2、…N,N为大于等于1的整数;所述利用所述训练用户的用户特征,训练获得第一分类模型包括:利用所述训练用户的关键特征,训练获得第1级迭代分类模型;利用所述训练用户的第j级用户特征,训练获得第j+1级迭代分类模型;其中,j=1、2……N;所述训练用户的第j级用户特征包括所述训练用户的关键特征以及第j级社交特征;所述训练用户的第j级社交特征根据所述训练用户的第1级迭代用户的第j级检测结果获得;所述训练用户的第1级迭代用户的第j级检测结果根据所述第1级迭代用户的第本文档来自技高网...
信息识别方法、模型训练方法、装置及处理设备

【技术保护点】
一种信息识别方法,其特征在于,包括:从检测用户的行为数据中提取所述检测用户的关键特征;其中,所述关键特征由表示身份信息的特征数据组成;根据所述检测用户的好友用户是否为目标身份信息的检测结果,获得所述检测用户的社交特征;根据所述检测用户的用户特征,利用第一分类模型获得所述检测用户的好友用户是否为所述目标身份信息的检测结果;其中,所述好友用户的用户特征包括所述好友用户的关键特征;所述第一分类模型预先根据训练用户的用户特征训练获得。

【技术特征摘要】
1.一种信息识别方法,其特征在于,包括:从检测用户的行为数据中提取所述检测用户的关键特征;其中,所述关键特征由表示身份信息的特征数据组成;根据所述检测用户的好友用户是否为目标身份信息的检测结果,获得所述检测用户的社交特征;根据所述检测用户的用户特征,利用第一分类模型获得所述检测用户的好友用户是否为所述目标身份信息的检测结果;其中,所述好友用户的用户特征包括所述好友用户的关键特征;所述第一分类模型预先根据训练用户的用户特征训练获得。2.根据权利要求1所述的方法,其特征在于,所述根据所述检测用户的好友用户是否为所述目标身份信息的检测结果,获得所述检测用户的社交特征之前,所述方法还包括:从所述检测用户的好友用户的行为数据中提取所述好友用户的关键特征;其中,所述关键特征由表示身份信息的特征数据组成;根据所述检测用户的好友用户的用户特征,利用第二分类模型获得所述检测用户的好友用户是否为所述目标身份信息的检测结果;其中,所述好友用户的用户特征包括所述好友用户的关键特征。3.根据权利要求2所述的方法,其特征在于,所述第二分类模型预先根据从训练用户的行为数据中提取的所述训练用户的关键特征训练获得;所述第一分类模型预先根据所述训练用户的关键特征以及社交特征训练获得;所述训练用户的社交特征根据所述训练用户的好友用户的检测结果获得;所述好友用户的检测结果根据所述好友用户的关键特征利用所述第二分类模型获得。4.根据权利要求2所述的方法,其特征在于,所述检测用户的好友用户的用户特征还包括所述检测用户的好友用户的社交特征;所述从所述检测用户的好友用户的行为数据中,提取所述检测用户的好友用户的关键特征包括:从所述检测用户的每一级迭代用户的行为数据中提取每一级迭代用户的关键特征;其中,所述检测用户的好友用户为所述检测用户的第1级迭代用户;,所述检测用户的第m级迭代用户分别与第m-1级迭代用户以及第m+1级迭代用户具有好友关系;m=1、2、…N,N为迭代训练次数且为大于等于1的整数;所述第二分类模型为第N级迭代分类模型;所述第一分类模型为第N+1级迭代分类模型;其中,第i级迭代用户的社交特征根据第i+1级迭代用户的检测结果获得,i=1、2…N-2;所述第i+1级迭代用户的检测结果按照如下方式获得:根据所述检测用户的第i+1级迭代用户的用户特征,利用第N-i级迭代分类模型,计算获得第i+1级迭代用户的检测结果;所述检测用户的第i+1级迭代用户的用户特征包括第i+1级迭代用户的关键特征以及社交特征;其中,第N级迭代用户的检测结果根据第N级迭代好友的关键特征利用第1级迭代分类模型计算获得;第N-1级迭代用户的社交特征根据第N级迭代用户的检测结果获得;所述第1级迭代分类模型预先根据从训练用户的行为数据中提取的所述训练用户的关键特征训练获得;所述第j+1级迭代分类模型基于所述第1级迭代分类模型进行迭代训练获得。5.根据权利要求4所述的方法,其特征在于,所述第j+1级迭代分类模型按照如下迭代训练方式预先训练获得,其中,j=1、2、3……N;将训练用户的第j级迭代用户的关键特征,输入第1级迭代分类模型,计算获得第j级迭代用户的第1级检测结果;根据所述训练用户第j级迭代用户的第1级检测结果,获得第j-1级迭代用户的第1级社交特征;对于所述训练用户第j-i级迭代用户,将第j-i级迭代用户的第i级用户特征输入第i+1级迭代分类模型,计算获得第j-i级迭代用户的第i+1级检测结果;i=1、2、3……N-2;所述第i级用户特征包括关键特征以及第i级社交特征;根据所述第j-i级迭代用户的第i+1级检测结果,获得第j-i-1级迭代用户的第i+1级社交特征;将获得的第1级迭代用户的第j-1级用户特征输入第j级迭代模型,计算获得所述第1级迭代用户的第j级检测结果;所述第j-1级用户特征包括关键特征以及第j-1级社交特征;利用所述第1级迭代好友的第j级检测结果,计算获得训练用户的第j级社交特征;利用所述训练用户的第j级用户特征,训练获得第j+1级迭代分类模型;所述训练用户的第j级用户特征包括所述训练用户的关键特征及第j级社交特征。6.根据权利要求2所述的方法,其特征在于,所述好友用户的检测结果为所述好友用户为所述目标身份信息的检测概率;所述根据所述好友用户的检测结果,获得所述检测用户的社交特征包括:根据每一个好友用户的检测概率计算平均检测概率,将所述平均检测概率作为所述检测用户的社交特征。7.根据权利要求1所述的方法,其特征在于,所述目标身份信息为目标学历信息;所述从检测用户的行为数据中,提取所述检测用户的表示身份信息的关键特征包括:从检测用户的行为数据中,提取至少由学历等级关键词、不同学历等级关键词出现次数以及所述学历等级关键词出现次数的归一化次数构成的关键特征。8.一种用于信息识别的模型训练方法,其特征在于,包括:从训练用户的行为数据中,提取所述训练用户的关键特征,其中,所述关键特征由表示身份信息的特征数据组成;根据所述训练用户的好友用户是否为目标身份信息的检测结果,获得所述训练用户的社交特征;利用所述训练用户的用户特征,训练获得第一分类模型;所述训练用户的用户特征包括所述训练用户的关键特征以及社交特征;所述第一分类模型用于根据检测用户的用户特征,识别所述检测用户的身份信息。9.根据权利要求8所述的方法,其特征在于,所述根据所述训练用户的好友用户是否为目标身份信息的检测结果,获得所述训练用户的社交特征之前,所述方法还包括:从训练用户的好友用户的行为数据中,提取训练用户的好友用户的关键特征;利用所述训练用户的关键特征,训练获得第二分类模型;将所述训练用户的好友用户的关键特征,输入第二分类模型,获得所述训练用户的好友用户是否为目标身份信息的检测结果。10.根据权利要求8所述的方法,其特征在于,所述从训练用户的行为数据中,提取所述训练用户的关键特征之后,所述方法还包括:从所述训练用户的每一级迭代用户的行为数据中,提取所述每一级迭代用户的关键特征;其中,所述训练用户的好友用户为所述训练用户的第1级迭代用户;所述训练用户的第m级迭代用户分别与第m-1级迭代用户以及第m+1级迭代用户具有好友关系;m=1、2、…N,N为大于等于1的整数;所述利用所述训练用户的用户特征,训练获得第一分类模型包括:利用所述训练用户的关键特征,训练获得第1级迭代分类模型;利用所述训练用户的第j级用户特征,训练获得第j+1级迭代分类模型;其中,j=1、2……N;所述训练用户的第j级用户特征包括所述训练用户的关键特征以及第j级社交特征;所述训练用户的第j级社交特征根据所述训练用户的第1级迭代用户的第j级检测结果获得;所述训练用户的第1级迭代用户的第j级检测结果根据所述第1级迭代用户的第j-1级用户特征,利用第j级迭代分类模型获得;其中,第N+1级迭代分类模型为所述第一分类模型,用于识别检测用户的身份信息,第j级迭代分类模型用于识别所述检测用户的第N-j+1级迭代用户的身份信息。11.根据权利要求10所述的方法,其特征在于,所述利用所述训练用户的第j级用户特征,训练获得第j+1级迭代分类模型包括:按照如下迭代训练方式进行训练,获得第j+1级迭代分类模型,其中,j=1、2、3……N:将训练用户的第j级迭代用户的关键特征,输入第1级迭代分类模型,计算获得第j级迭代用户的第1级检测结果;根据所述训练用户的第j级迭代用户的第1级检测结果,获得所述训练用户的第j-1级迭代用户的第1级社交特征;对于所述训练用户的第j-i级迭代用户,将所述训练用户的第j-i级迭代用户的第i级用户特征输入第i+1级迭代分类模型,计算获得所述训练用户的第j-i级迭代用户的第i+1级检测结果;i=1、2、3……N-2;所述第j-i级迭代用户的第i级用户特征包括所述第j-i级迭代用户的关键特征以及第i级社交特征;根据所述训练用户的第j-i级迭代用户的第i+1级检测结果,获得所述训练用户的第j-i-1级迭代用户的第i+1级社交特征;将获得的第1级迭代用户的第j-1级用户特征输入第j级迭代模型,计算获得所述第1级迭代用户的第j级检测结果;所述第j-1级用户特征包括关键特征以及第j-1级社交特征;利用所述第1级迭代好友的第j级检测结果,计算获得训练用户的第j级社交特征;利用所述训练用户的第j级用户特征,训练获得第j+1级迭代分类模型;所述训练用户的第j级用户特征包括所述训练用户的关键特征及第j级社交特征。12.一种处理设备,其特征在于,包括存储器以及处理器;所述存储器存储一组或多组程序指令;所述处理器调用所述一组或多组程序指令,执行如下操作:从检测用户的行为数据中提取所述检测用户的关键特征;其中,所述关键特征由表示身份信息的特征数据组成;根据所述检测用户的好友用户是否为目标身份信息的检测结果,获得所述检测用户的社交特征;根据所述检测用户的用户特征,利用第一分类模型获得所述检测用户的好友用户是否为所述目标身份信息的检测结果;其中,所述好友用户的用户特征包括所述好友用户的关键特征;所述第一分类模型预先根据训练用户的用户特征训练获得。13.根据权利要求12所述的设备,其特征在于,所述处理器还用于:从所述检测用户的好友用户的行为数据中提取所述好友用户的关键特征;其中,所述关键特征由表示身份信息的特征数据组成;根据所述检测用户的好友用户的用户特征,利用第二分类模型获得所述检测用户的好友用户是否为所述目标身份信息的检测结果;其中,所述好友用户的用户特征包括所述好友用户的关键特征。14.根据权利要求13所述的设备,其特征在于,所述检测用户的好友用户的用户特征还包括所述检测用户的好友用户的社交特征;所述处理器从所述检测用户的好友用户的行为数据中,提取所述检测用户的好友用户的关键特征包括:从所述检测用户的每一级迭代用户的行为数据中提取每一级迭代用户的关键特征;其中,所述检测用户的好友用户为所述检测用户的第1级迭代用户;,所述检测用户的第m级迭代用户分别与第m-1级迭代用户以及第m+1级迭代用户具有好友关系;m=1、2、…N,N为迭代训练次数且为大于等于1的整数;所述第二分类模型为第N级迭代分类模型;所述第一分类模型为第N+1级迭代分类模型;其中,第i级迭代用户的社交特征根据第i+1级迭代用户的检测结果获得,i=1、2…N-2;所述第i+1级迭代用户的检测结果按照如下方式获得:根据所述检测用户的第i+1级迭代用户的用户特征,利用第N-i级迭代分类模型,计算获得第i+1级迭代用户的检测结果;所述检测用户的第i+1级迭代用户的用户特征包括第i+1级迭代用户的关键特征以及社交特征;其中,第N级迭代用户的检测结果根据第N级迭代好友...

【专利技术属性】
技术研发人员:李辉钟观海操颖平
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1