【技术实现步骤摘要】
一种内容质量评估方法、装置、设备和介质
本专利技术实施例涉及互联网
,尤其涉及一种内容质量评估方法、装置、设备和介质。
技术介绍
随着互联网行业的飞速发展,用户评论作为用户交互特有的一种资源变得越来越有价值,用户评论不仅能够引导用户的消费决策,还能对品牌口碑的建立起到决定性的作用。然而,用户评论的质量参差不齐,因此需要对评论的质量进行评估,以确定出优质评论。目前业内已知的评估方法仍停留在对低俗评论的识别,优质评论的识别仍需要人工的方式介入。专利技术人在实现本专利技术的过程中发现,现有技术存在如下缺陷:1)效率低,优质评论的识别需要人工介入,在互联网数据海量增长的今天,这无疑是一项非常耗时的工作。2)客观性差,优质评论的识别需要人工进行干预,然而不同的人对于同一个评论的评估结果或许大相径庭,人工评估存在客观性差的弊端。
技术实现思路
本专利技术实施例提供一种内容质量评估方法、装置、设备和介质,以实现对优质内容的自动识别。第一方面,本专利技术实施例提供了一种内容质量评估方法,该方法包括:提取待评估内容的特征,其中所述特征包括丰富度、相关度和健康度中至少两个维度的特征 ...
【技术保护点】
1.一种内容质量评估方法,其特征在于,包括:提取待评估内容的特征,其中所述特征包括丰富度、相关度和健康度中至少两个维度的特征;根据所述特征,利用预先训练的质量评估模型对所述待评估内容进行评估;根据评估结果确定优质内容。
【技术特征摘要】
1.一种内容质量评估方法,其特征在于,包括:提取待评估内容的特征,其中所述特征包括丰富度、相关度和健康度中至少两个维度的特征;根据所述特征,利用预先训练的质量评估模型对所述待评估内容进行评估;根据评估结果确定优质内容。2.根据权利要求1所述的方法,其特征在于,所述特征的确定包括:基于贡献度对内容样本进行特征筛选,将筛选后的特征作为所述特征。3.根据权利要求1所述的方法,其特征在于,所述特征的确定包括:对确定的初始特征进行组合;根据不同特征组合进行准确率的交叉验证;根据交叉验证结果确定最佳特征组合,并将最佳特征组合中的初始特征作为所述特征。4.根据权利要求1所述的方法,其特征在于,所述质量评估模型的确定包括:根据所述特征,利用不同分类算法进行准确率的交叉验证;根据交叉验证结果确定最佳分类算法;根据所述最佳分类算法确定所述质量评估模型。5.根据权利要求1所述的方法,其特征在于,所述丰富度的特征包括:所述待评论内容的总字数、所述待评论内容中的图片数、所述待评论内容中是否有重复内容、所述待评论内容中词性的种类、所述待评论内容是否有语义和所述待评论内容中包含图片的种类中的至少一种子特征;所述相关度的特征包括:内...
【专利技术属性】
技术研发人员:魏甘露,柏馨,邢潘红,魏晨辉,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。