目标对象的等级确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26172550 阅读:72 留言:0更新日期:2020-10-31 13:50
本发明专利技术实施例提供了一种目标对象的等级确定方法、装置、电子设备及存储介质,上述方法包括:获得目标对象的目标数据;从目标数据中提取目标对象的特征信息;将特征信息分别输入预先训练的第一等级确定模型和预先训练的第二等级确定模型,得到第一等级确定模型输出的第一输出结果,和第二等级确定模型输出的第二输出结果;比较第一输出结果与第二输出结果;当第一输出结果与第二输出结果的等级相同时,将第一输出结果的等级或者第二输出结果的等级确定为目标对象的等级;当第一输出结果与第二输出结果的等级不相同时,将第一输出结果与第二输出结果中高的等级确定为目标对象的等级。采用发明专利技术实施例提供的方法,提高了确定目标对象等级的效率。

【技术实现步骤摘要】
目标对象的等级确定方法、装置、电子设备及存储介质
本专利技术涉及深度学习
,特别是涉及一种目标对象的等级确定方法、装置、电子设备及存储介质。
技术介绍
目前,针对同一应用场景下的多个目标对象的分类问题,通常可以根据目标对象的特征信息,对目标对象进行等级标注,进而按照目标对象的等级实现对目标对象的分类。以视频软件为例,视频软件可以通过标注用户等级的方式对其注册用户进行分类。例如,视频软件A可以根据其注册用户的特征信息,对其注册用户标注0-5级的用户等级。当注册用户的特征信息包括用户的活跃程度和用户所上传的视频的内容质量时,用户等级0级可以表示新注册视频软件A的用户,1-5级均可以反映视频软件A的注册用户的活跃程度和用户所上传的视频的内容质量,并且用户的活跃程度越高和用户所上传的视频的内容质量越高,用户的等级越高。同样的,视频软件也可以通过标注内容等级的方式对视频软件中的多种内容数据进行分类。例如,视频软件A可以根据内容数据的特征信息,对多种内容数据分别标注不同的等级,实现对多种内容数据的分类。然而,对目标对象进行等级标注,目前主要是通过运营人员人工标注,而人工标注等级往往会导致标注效率较低。此外,由于运营人员对不同等级的标准把握不一定正确,因此,通过运营人员人工标注目标对象的等级,会导致标注等级的正确率较低。
技术实现思路
本专利技术实施例的目的在于提供一种目标对象的等级确定方法、装置、电子设备及存储介质,以提高标注用户等级的正确率。达到上述目的,本专利技术实施例提供了一种目标对象的等级确定方法,包括:获得目标对象的目标数据;从所述目标数据中提取目标对象的特征信息;将所述特征信息分别输入预先训练的第一等级确定模型和预先训练的第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和所述第二等级确定模型输出的表示所述目标对象等级信息的第二输出结果;其中,所述第一等级确定模型为基于第一训练样本集进行训练得到的,所述第一训练样本集包含:多种等级类型的多个样本对象、各个样本对象的特征信息以及每个所述样本对象标注的等级信息;所述第二等级确定模型为基于第二训练样本集进行训练得到的,所述第二训练样本集为所述第一训练样本集的子集;其中,所述第二训练样本集中不包含:所述第一训练样本集中指定等级的样本对象的特征信息;比较所述第一输出结果与所述第二输出结果;当所述第一输出结果与所述第二输出结果的等级相同时,将所述第一输出结果的等级或者所述第二输出结果的等级确定为所述目标对象的等级;当所述第一输出结果与所述第二输出结果的等级不相同时,将所述第一输出结果与所述第二输出结果中高的等级确定为所述目标对象的等级。进一步的,所述第二等级确定模型的数量为多个;所述将所述特征信息分别输入预先训练的第一等级确定模型和预先训练的第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和所述第二等级确定模型输出的表示所述目标对象等级信息的第二输出结果,包括:将所述特征信息分别输入预先训练的第一等级确定模型和多个预先训练的各个第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和各个所述第二等级确定模型输出的表示所述目标对象等级信息的多个第二输出结果;所述比较所述第一输出结果与所述第二输出结果;当所述第一输出结果与所述第二输出结果的等级相同时,将所述第一输出结果的等级或者所述第二输出结果的等级确定为所述目标对象的等级;当所述第一输出结果与所述第二输出结果的等级不相同时,将所述第一输出结果与所述第二输出结果中高的等级确定为所述目标对象的等级,包括:根据所述第一输出结果和所述多个第二输出结果,统计各个等级的数量;根据所述各个等级的数量,判断是否只有一个数量最多的等级;如果是,将该数量最多的等级确定为所述目标对象的等级;如果不是,将数量最多的等级中,最高的等级确定为所述目标对象的等级。进一步的,所述目标对象为目标用户;所述获得目标对象的目标数据,包括:获得目标用户上传的内容数据和/或目标用户的历史上传行为数据;所述从所述目标数据中提取目标对象的特征信息的步骤,包括:获得所述目标用户已上传的内容数据的类型;计算目标用户已上传的内容数据中,各种类型的内容数据所占的比例作为内容特征信息;和/或基于目标用户的历史上传行为数据,获得目标用户上传内容数据的频率,作为活跃度特征信息。进一步的,所述目标对象为目标用户;所述获得目标对象的目标数据,包括:获得目标用户的日志数据,以及外部平台对所述目标用户的信用评分;所述从所述目标数据中提取目标对象的特征信息,包括:从所述日志数据中,提取目标用户的指标数据,所述指标数据包括:目标用户的用户指数等级、信用等级、用户已上传内容数据中低质内容数据占比、用户已上传内容数据中侵权内容数据占比、用户已上传内容数据中原创内容数据占比、用户已上传内容数据中转载内容数据占比、用户日均上传内容数据数和用户最后上传内容数据的时间中的一个或多个指标数据;将提取出的一个或多个指标数据和所述信用评分,作为特征信息。进一步的,所述目标对象为目标内容数据;所述的目标数据包括:目标内容数据的用户访问数据和/或目标内容数据的用户评价数据;所述从所述目标数据中提取目标对象的特征信息的步骤,包括:基于所述目标内容数据的用户访问数据,确定所述目标内容数据的用户访问热度,作为热度特征信息;和/或基于所述目标内容数据的用户评价数据,确定所述目标内容数据的用户好评率,作为用户评价特征信息。进一步的,采用如下步骤基于第一训练样本集训练得到所述第一等级确定模型:将所述第一训练样本集中第一预设数量的所述样本对象的特征信息分别输入第一待训练随机森林模型,对应得到第一预设数量的输出结果;基于所述样本对象的标注等级信息,计算所述第一待训练随机森林模型的输出结果的正确率,所述正确率为所述第一预设数量的输出结果中,与标注的所述样本对象的等级相同的输出结果的占比;判断所述正确率是否小于预设正确率阈值;当所述正确率不小于预设正确率阈值时,将当前的所述第一待训练随机森林模型确定为训练得到的所述第一等级确定模型;当所述正确率小于预设正确率阈值时,调整所述第一待训练随机森林模型的参数,得到新的第一待训练随机森林模型,并返回所述将所述第一训练样本集中第一预设数量的所述样本对象的特征信息分别输入第一待训练随机森林模型的步骤。进一步的,采用如下步骤基于第二训练样本集训练得到所述第二等级确定模型:将所述第二训练样本集中第二预设数量的所述样本对象的特征信息分别输入第二待训练随机森林模型,对应得到第二预设数量的输出结果;基于所述样本对象的标注等级信息,计算所述第二待训练随机森林模型的输出结果的正确率,所述正本文档来自技高网...

【技术保护点】
1.一种目标对象的等级确定方法,其特征在于,包括:/n获得目标对象的目标数据;/n从所述目标数据中提取目标对象的特征信息;/n将所述特征信息分别输入预先训练的第一等级确定模型和预先训练的第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和所述第二等级确定模型输出的表示所述目标对象等级信息的第二输出结果;其中,所述第一等级确定模型为基于第一训练样本集进行训练得到的,所述第一训练样本集包含:多种等级类型的多个样本对象、各个样本对象的特征信息以及每个所述样本对象标注的等级信息;所述第二等级确定模型为基于第二训练样本集进行训练得到的,所述第二训练样本集为所述第一训练样本集的子集;其中,所述第二训练样本集中不包含:所述第一训练样本集中指定等级的样本对象的特征信息;/n比较所述第一输出结果与所述第二输出结果;/n当所述第一输出结果与所述第二输出结果的等级相同时,将所述第一输出结果的等级或者所述第二输出结果的等级确定为所述目标对象的等级;/n当所述第一输出结果与所述第二输出结果的等级不相同时,将所述第一输出结果与所述第二输出结果中高的等级确定为所述目标对象的等级。/n...

【技术特征摘要】
1.一种目标对象的等级确定方法,其特征在于,包括:
获得目标对象的目标数据;
从所述目标数据中提取目标对象的特征信息;
将所述特征信息分别输入预先训练的第一等级确定模型和预先训练的第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和所述第二等级确定模型输出的表示所述目标对象等级信息的第二输出结果;其中,所述第一等级确定模型为基于第一训练样本集进行训练得到的,所述第一训练样本集包含:多种等级类型的多个样本对象、各个样本对象的特征信息以及每个所述样本对象标注的等级信息;所述第二等级确定模型为基于第二训练样本集进行训练得到的,所述第二训练样本集为所述第一训练样本集的子集;其中,所述第二训练样本集中不包含:所述第一训练样本集中指定等级的样本对象的特征信息;
比较所述第一输出结果与所述第二输出结果;
当所述第一输出结果与所述第二输出结果的等级相同时,将所述第一输出结果的等级或者所述第二输出结果的等级确定为所述目标对象的等级;
当所述第一输出结果与所述第二输出结果的等级不相同时,将所述第一输出结果与所述第二输出结果中高的等级确定为所述目标对象的等级。


2.根据权利要求1所述的方法,其特征在于,所述第二等级确定模型的数量为多个;
所述将所述特征信息分别输入预先训练的第一等级确定模型和预先训练的第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和所述第二等级确定模型输出的表示所述目标对象等级信息的第二输出结果,包括:
将所述特征信息分别输入预先训练的第一等级确定模型和多个预先训练的各个第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和各个所述第二等级确定模型输出的表示所述目标对象等级信息的多个第二输出结果;
所述比较所述第一输出结果与所述第二输出结果;当所述第一输出结果与所述第二输出结果的等级相同时,将所述第一输出结果的等级或者所述第二输出结果的等级确定为所述目标对象的等级;当所述第一输出结果与所述第二输出结果的等级不相同时,将所述第一输出结果与所述第二输出结果中高的等级确定为所述目标对象的等级,包括:
根据所述第一输出结果和所述多个第二输出结果,统计各个等级的数量;
根据所述各个等级的数量,判断是否只有一个数量最多的等级;
如果是,将该数量最多的等级确定为所述目标对象的等级;
如果不是,将数量最多的等级中,最高的等级确定为所述目标对象的等级。


3.根据权利要求1所述的方法,其特征在于,所述目标对象为目标用户;所述获得目标对象的目标数据,包括:
获得目标用户上传的内容数据和/或目标用户的历史上传行为数据;
所述从所述目标数据中提取目标对象的特征信息的步骤,包括:
获得所述目标用户已上传的内容数据的类型;
计算目标用户已上传的内容数据中,各种类型的内容数据所占的比例作为内容特征信息;和/或
基于目标用户的历史上传行为数据,获得目标用户上传内容数据的频率,作为活跃度特征信息。


4.根据权利要求1所述的方法,其特征在于,所述目标对象为目标用户;
所述获得目标对象的目标数据,包括:
获得目标用户的日志数据,以及外部平台对所述目标用户的信用评分;
所述从所述目标数据中提取目标对象的特征信息,包括:
从所述日志数据中,提取目标用户的指标数据,所述指标数据包括:目标用户的用户指数等级、信用等级、用户已上传内容数据中低质内容数据占比、用户已上传内容数据中侵权内容数据占比、用户已上传内容数据中原创内容数据占比、用户已上传内容数据中转载内容数据占比、用户日均上传内容数据数和用户最后上传内容数据的时间中的一个或多个指标数据;
将提取出的一个或多个指标数据和所述信用评分,作为特征信息。


5.根据权利要求1所述的方法,其特征在于,所述目标对象为目标内容数据;所述的目标数据包括:目标内容数据的用户访问数据和/或目标内容数据的用户评价数据...

【专利技术属性】
技术研发人员:赵艳杰段效晨康林秦占明罗廷方
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1