【技术实现步骤摘要】
目标对象的等级确定方法、装置、电子设备及存储介质
本专利技术涉及深度学习
,特别是涉及一种目标对象的等级确定方法、装置、电子设备及存储介质。
技术介绍
目前,针对同一应用场景下的多个目标对象的分类问题,通常可以根据目标对象的特征信息,对目标对象进行等级标注,进而按照目标对象的等级实现对目标对象的分类。以视频软件为例,视频软件可以通过标注用户等级的方式对其注册用户进行分类。例如,视频软件A可以根据其注册用户的特征信息,对其注册用户标注0-5级的用户等级。当注册用户的特征信息包括用户的活跃程度和用户所上传的视频的内容质量时,用户等级0级可以表示新注册视频软件A的用户,1-5级均可以反映视频软件A的注册用户的活跃程度和用户所上传的视频的内容质量,并且用户的活跃程度越高和用户所上传的视频的内容质量越高,用户的等级越高。同样的,视频软件也可以通过标注内容等级的方式对视频软件中的多种内容数据进行分类。例如,视频软件A可以根据内容数据的特征信息,对多种内容数据分别标注不同的等级,实现对多种内容数据的分类。然而,对目标对象进行等级标注,目前主要是通过运营人员人工标注,而人工标注等级往往会导致标注效率较低。此外,由于运营人员对不同等级的标准把握不一定正确,因此,通过运营人员人工标注目标对象的等级,会导致标注等级的正确率较低。
技术实现思路
本专利技术实施例的目的在于提供一种目标对象的等级确定方法、装置、电子设备及存储介质,以提高标注用户等级的正确率。达到上述目的,本专利技术实施 ...
【技术保护点】
1.一种目标对象的等级确定方法,其特征在于,包括:/n获得目标对象的目标数据;/n从所述目标数据中提取目标对象的特征信息;/n将所述特征信息分别输入预先训练的第一等级确定模型和预先训练的第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和所述第二等级确定模型输出的表示所述目标对象等级信息的第二输出结果;其中,所述第一等级确定模型为基于第一训练样本集进行训练得到的,所述第一训练样本集包含:多种等级类型的多个样本对象、各个样本对象的特征信息以及每个所述样本对象标注的等级信息;所述第二等级确定模型为基于第二训练样本集进行训练得到的,所述第二训练样本集为所述第一训练样本集的子集;其中,所述第二训练样本集中不包含:所述第一训练样本集中指定等级的样本对象的特征信息;/n比较所述第一输出结果与所述第二输出结果;/n当所述第一输出结果与所述第二输出结果的等级相同时,将所述第一输出结果的等级或者所述第二输出结果的等级确定为所述目标对象的等级;/n当所述第一输出结果与所述第二输出结果的等级不相同时,将所述第一输出结果与所述第二输出结果中高的等级确定为所述目标对象的等级 ...
【技术特征摘要】
1.一种目标对象的等级确定方法,其特征在于,包括:
获得目标对象的目标数据;
从所述目标数据中提取目标对象的特征信息;
将所述特征信息分别输入预先训练的第一等级确定模型和预先训练的第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和所述第二等级确定模型输出的表示所述目标对象等级信息的第二输出结果;其中,所述第一等级确定模型为基于第一训练样本集进行训练得到的,所述第一训练样本集包含:多种等级类型的多个样本对象、各个样本对象的特征信息以及每个所述样本对象标注的等级信息;所述第二等级确定模型为基于第二训练样本集进行训练得到的,所述第二训练样本集为所述第一训练样本集的子集;其中,所述第二训练样本集中不包含:所述第一训练样本集中指定等级的样本对象的特征信息;
比较所述第一输出结果与所述第二输出结果;
当所述第一输出结果与所述第二输出结果的等级相同时,将所述第一输出结果的等级或者所述第二输出结果的等级确定为所述目标对象的等级;
当所述第一输出结果与所述第二输出结果的等级不相同时,将所述第一输出结果与所述第二输出结果中高的等级确定为所述目标对象的等级。
2.根据权利要求1所述的方法,其特征在于,所述第二等级确定模型的数量为多个;
所述将所述特征信息分别输入预先训练的第一等级确定模型和预先训练的第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和所述第二等级确定模型输出的表示所述目标对象等级信息的第二输出结果,包括:
将所述特征信息分别输入预先训练的第一等级确定模型和多个预先训练的各个第二等级确定模型,得到所述第一等级确定模型输出的表示所述目标对象等级信息的第一输出结果,和各个所述第二等级确定模型输出的表示所述目标对象等级信息的多个第二输出结果;
所述比较所述第一输出结果与所述第二输出结果;当所述第一输出结果与所述第二输出结果的等级相同时,将所述第一输出结果的等级或者所述第二输出结果的等级确定为所述目标对象的等级;当所述第一输出结果与所述第二输出结果的等级不相同时,将所述第一输出结果与所述第二输出结果中高的等级确定为所述目标对象的等级,包括:
根据所述第一输出结果和所述多个第二输出结果,统计各个等级的数量;
根据所述各个等级的数量,判断是否只有一个数量最多的等级;
如果是,将该数量最多的等级确定为所述目标对象的等级;
如果不是,将数量最多的等级中,最高的等级确定为所述目标对象的等级。
3.根据权利要求1所述的方法,其特征在于,所述目标对象为目标用户;所述获得目标对象的目标数据,包括:
获得目标用户上传的内容数据和/或目标用户的历史上传行为数据;
所述从所述目标数据中提取目标对象的特征信息的步骤,包括:
获得所述目标用户已上传的内容数据的类型;
计算目标用户已上传的内容数据中,各种类型的内容数据所占的比例作为内容特征信息;和/或
基于目标用户的历史上传行为数据,获得目标用户上传内容数据的频率,作为活跃度特征信息。
4.根据权利要求1所述的方法,其特征在于,所述目标对象为目标用户;
所述获得目标对象的目标数据,包括:
获得目标用户的日志数据,以及外部平台对所述目标用户的信用评分;
所述从所述目标数据中提取目标对象的特征信息,包括:
从所述日志数据中,提取目标用户的指标数据,所述指标数据包括:目标用户的用户指数等级、信用等级、用户已上传内容数据中低质内容数据占比、用户已上传内容数据中侵权内容数据占比、用户已上传内容数据中原创内容数据占比、用户已上传内容数据中转载内容数据占比、用户日均上传内容数据数和用户最后上传内容数据的时间中的一个或多个指标数据;
将提取出的一个或多个指标数据和所述信用评分,作为特征信息。
5.根据权利要求1所述的方法,其特征在于,所述目标对象为目标内容数据;所述的目标数据包括:目标内容数据的用户访问数据和/或目标内容数据的用户评价数据...
【专利技术属性】
技术研发人员:赵艳杰,段效晨,康林,秦占明,罗廷方,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。