内容质量评估方法、模型训练方法及相关装置制造方法及图纸

技术编号:33291001 阅读:57 留言:0更新日期:2022-05-01 00:09
本申请提供的内容质量评估方法、模型训练方法及相关装置中;评估设备获取媒体资源的历史统计信息以及媒体资源的固有属性信息,然后,通过预先训练的评分模型综合上述因素对媒体资源的内容质量进行合理评估,从而获得更为准确、合理的目标得分,用于评估用户对媒体资源的喜好程度。源的喜好程度。源的喜好程度。

【技术实现步骤摘要】
内容质量评估方法、模型训练方法及相关装置


[0001]本申请涉及数据处理领域,具体而言,涉及一种内容质量评估方法、模型训练方法及相关装置。

技术介绍

[0002]随着互联网、移动互联网的快速发展,互联网平台上媒体资源的数量急剧增大,并且同质化(标题相同或者简介类似)内容数量较多,如何对这些媒体资源进行量化分析,确定媒体资源的内容质量是一个非常关键和紧急的任务。
[0003]目前在对媒体资源进行量化分析时,多依赖于媒体资源的浏览统计信息;而研究发现,浏览统计信息并不能客观反映媒体资源的内容质量,且存在一定的滞后性。

技术实现思路

[0004]为了克服现有技术中的至少一个不足,本申请提供一种内容质量评估方法及相关装置,包括:
[0005]第一方面,本申请提供一种内容质量评估方法,应用于评估设备,所述方法包括:
[0006]获取媒体资源的第一特征以及第二特征,其中,所述第一特征包括所述媒体资源的浏览统计信息,所述第二特征包括所述媒体资源的固有属性信息;
[0007]将所述第一特征以及所述第二特征输入到预先训练的评分模型,获得所述媒体资源的目标得分,其中,所述目标得分用于评估用户对所述媒体资源的喜好程度。
[0008]第二方面,本申请提供一种内容质量评估装置,应用于评估设备,所述内容质量评估装置包括:
[0009]特征模块,用于获取媒体资源的第一特征以及第二特征,其中,所述第一特征包括所述媒体资源的浏览统计信息,所述第二特征包括所述媒体资源的固有属性信息;/>[0010]评分模块,用于将所述第一特征以及所述第二特征输入到预先训练的评分模型,获得所述媒体资源的目标得分,其中,所述目标得分用于评估用户对所述媒体资源的喜好程度。
[0011]第三方面,本申请提供一种评估设备,所述评估设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述的内容质量评估方法。
[0012]第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述的内容质量评估方法。
[0013]相对于现有技术而言,本申请具有以下有益效果:
[0014]本申请提供的内容质量评估方法、模型训练方法及相关装置中;评估设备获取媒体资源的历史统计信息以及媒体资源的固有属性信息,然后,通过预先训练的评分模型综合上述因素对媒体资源的内容质量进行合理评估,从而获得更为准确、合理的目标得分,用于评估用户对媒体资源的喜好程度。
附图说明
[0015]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0016]图1为本申请实施例提供的评估设备的结构框图;
[0017]图2为本申请实施例提供的内容质量评估方法流程示意图;
[0018]图3为本申请实施例提供的模型训练方法流程示意图;
[0019]图4为本申请实施例提供的内容质量评估装置结构框图;
[0020]图5为本申请实施例提供的模型训练方法原理示意图。
[0021]图标:120

存储器;130

处理器;140

通信单元;201

特征模块;202

评分模块。
具体实施方式
[0022]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
[0023]因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0024]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0025]目前在对媒体资源进行量化分析时,多依赖于媒体资源的浏览统计信息;而研究发现,浏览统计信息并不能客观反映媒体资源的内容质量,且存在一定的滞后性。
[0026]例如,浏览统计信息可以包括媒体资源的历史播放量、订阅数量、点击量、留存率等。虽然上述浏览统计信息能够在一定程度上反映媒体资源的质量,例如,历史播放量、订阅数量、点击量、留存率等数据较大时,说明对应的媒体资源具有较高的内容质量,受到观众的喜爱;但是,上述浏览统计信息可以通过不合规的方式进行提高,例如,通过水军提高媒体资源的浏览统计信息。
[0027]此外,对于一些新创作的媒体资源,难以在短时间内获得足够多的浏览统计信息,也即是说,媒体资源短时间内的浏览统计信息不具有客观的参考意义。因此,仅依靠媒体资源的浏览统计信息,并不能客观反映媒体资源的内容质量。
[0028]鉴于此,本实施例提供一种应用于评估设备的内容质量评估方法。该方法中,评估设备获取媒体资源的历史统计信息以及媒体资源的固有属性信息,然后,通过预先训练的评分模型综合上述因素对媒体资源的内容质量进行合理评估,从而获得更为准确、合理的目标得分,用于评估用户对媒体资源的喜好程度。
[0029]其中,该评估设备可以是服务器,服务器的类型可以是,但不限于,Web(网站)服务器、FTP(File Transfer Protocol,文件传输协议)服务器、数据处理服务器等。此外,该服
务器可以是单个服务器,也可以是服务器组。服务器组可以是集中式的,也可以是分布式的(例如,服务器可以是分布式系统)。在一些实施例中,服务器相对于用户终端,可以是本地的、也可以是远程的。在一些实施例中,服务器可以在云平台上实现;仅作为示例,云平台可以包括私有云、公有云、混合云、社区云(community cloud)、分布式云、跨云(inter

cloud)、多云(multi

cloud)等,或者它们的任意组合。在一些实施例中,服务器可以在具有一个或多个组件的电子设备上实现。
[0030]如图1所示,本实施例提供的评估设备结构框图中,该评估设备可以包括存储器120、处理器130、通信单元140。该存储器120、处理器130以及通信单元140各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
[0031]其中,该存储器120可以是,但不限于,随机存取存储器(Random A本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种内容质量评估方法,其特征在于,应用于评估设备,所述方法包括:获取媒体资源的第一特征以及第二特征,其中,所述第一特征包括所述媒体资源的浏览统计信息,所述第二特征包括所述媒体资源的固有属性信息;将所述第一特征以及所述第二特征输入到预先训练的评分模型,获得所述媒体资源的目标得分,其中,所述目标得分用于评估用户对所述媒体资源的喜好程度。2.根据权利要求1所述的内容质量评估方法,其特征在于,所述将所述第一特征以及所述第二特征输入到预先训练的评分模型,获得所述媒体资源的目标得分,包括:将所述第一特征以及所述第二特征输入到预先训练的评分模型,获得所述评分模型输出的多个分类概率,其中,所述多个分类概率分别表示所述媒体资源与不同质量得分之间的匹配程度;根据所述多个分类概率以及所述多个分类概率分别对应的质量得分,获得所述媒体资源的目标得分,其中,基础得分在所述目标得分中的占比最高,所述基础得分表示所述多个分类概率中最大分类概率对应的质量得分。3.根据权利要求2所述的内容质量评估方法,其特征在于,所述根据所述多个分类概率以及所述多个分类概率分别对应的质量得分,获得所述媒体资源的目标得分,包括:根据所述多个分类概率,将所述最大分类概率对应的质量得分作为所述基础得分;根据剩余分类概率以及所述剩余分类概率各自对应的质量得分,获得期望得分,其中,所述剩余分类概率未包括所述最大分类概率;将所述基础得分与所述期望得分之和,作为所述目标得分。4.根据权利要求1所述的内容质量评估方法,其特征在于,所述根据剩余分类概率以及所述剩余分类概率各自对应的质量得分,获得期望得分,包括:若所述最大分类概率对应的质量得分为最大质量得分,则通过以下表达式计算所述期望得分E:E=p
max
*(1

f(S))若所述最大分类概率对应的质量得分非最大质量得分,则通过以下表达式计算所述期望得分E:E=f(S)式中,i表示将所有质量...

【专利技术属性】
技术研发人员:赵向洋王哲覃志奎
申请(专利权)人:上海喜马拉雅科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1