文章质量的确定方法、文章筛选方法、以及相应的装置制造方法及图纸

技术编号:22308454 阅读:17 留言:0更新日期:2019-10-16 08:33
本申请实施例提供了一种文章质量的确定方法、文章筛选方法、以及相应的装置,涉及计算机领域。该方法包括:获取关于同一话题的至少两个文章;对于至少两个文章中待处理的目标文章,确定目标文章的质量评估参数,质量评估参数包括语义覆盖度或文章信息量中的至少一个,其中,语义覆盖度是表征了目标文章和至少两个文章中其他文章的文章相关性;根据目标文章的质量评估参数确定文章的文章质量。基于本申请所提供的方案,能够有效提高文章质量评估的客观性及准确性。

The determination method of article quality, article screening method and corresponding devices

【技术实现步骤摘要】
文章质量的确定方法、文章筛选方法、以及相应的装置
本申请涉及计算机领域,具体而言,本申请涉及一种文章质量的确定方法、文章筛选方法、以及相应的装置。
技术介绍
目前,在许多实际应用场景中,都需要对文章的质量进行评价。例如,很多的应用程序中为用户推送的文章,在将文章推送给用户之前,文章的质量也基本上都是经过评估的。现有的文章质量评估方法主要有以下几种:一种常用的方式是通过文章质量预测模型来预测文章质量,但是对于模型的训练,需要大量样本数据,且需要对大量样本数据进行标注,训练成本较高,且由于对样本数据的标注的标准比较主观,基于模型预测文章质量的准确性也不准确。另一种常用方式是依据用户对文章的操作行为(如用户对文章的评分、用户对文章的点击量等等)来评估文章质量,但是该方案的评估客观性及准确性也较低。
技术实现思路
为了解决现有技术中所在的问题中的至少一个,本申请实施例提供了一种文章质量的确定方法、文章筛选方法、以及相应的装置,基于本申请实施例所提供的方案,能够有效提高文章质量评估准确性。本申请实施例所提供的技术方案如下:本申请实施例的第一方面,提供了一种文章质量的确定方法,该方法包括:获取关于同一话题的至少两个文章;对于至少两个文章中待处理的目标文章,确定目标文章的质量评估参数,其中,质量评估参数包括语义覆盖度和文章信息量,语义覆盖度表征了目标文章和至少两个文章中除目标文章之外的其他文章的文章相关性;根据目标文章的质量评估参数确定目标文章的文章质量。在一种可选的实施方式中,文章相关性包括语义相似度,确定目标文章的语义覆盖度,包括:分别确定目标文章与其他文章中每个文章的语义相似度;根据目标文章与其他文章中的每个文章的语义相似度,确定目标文章的语义覆盖度。在一种可选的实施方式中,确定目标文章的文章信息量,包括:提取目标文章的关键词,并确定各关键词的信息量;根据目标文章中各关键词的信息量,确定目标文章的文章信息量。在一种可选的实施方式中,关键词的信息量是指在至少两个文章中,关键词为文章提供的信息量。在一种可选的实施方式中,目标文章的文章质量通过目标文章的文章质量得分表征;根据目标文章的质量评估参数确定目标文章的文章质量,包括:获取语义覆盖度的第一权重和文章信息量的第二权重;根据语义覆盖度、文章信息量、第一权重、以及第二权重,确定目标文章的文章质量得分。在一种可选的实施方式中,目标文章的文章质量通过目标文章的文章质量得分表征,该方法还包括:获取目标文章的影响力评估参数;根据目标文章的影响力评估参数,确定目标文章的文章质量得分的调节系数;根据目标文章的质量评估参数确定目标文章的文章质量,包括:根据质量评估参数确定目标文章的初始质量得分;根据初始质量得分和调节系数,确定目标文章的文章质量得分。在一种可选的实施方式中,影响力评估参数包括以下至少一种:文章的原创性、用户对文章的操作行为信息、或者文章所对应的发布媒体的媒体等级。本申请实施例的第二方面,提供了一种文章筛选方法,该方法包括:获取关于同一话题的至少两个待处理文章;确定每个待处理文章的文章质量,其中,文章质量基于本申请实施例第一方面或第一方面的任一可选实施方式中所提供的文章质量的确定方法确定的;根据每个待处理文章的文章质量,对至少两个待处理文章进行筛选。在一种可选的实施方式中,文章质量通过待处理文章的文章质量得分表征,待处理文章为待发布文章或待推送文章;根据每个待处理文章的文章质量,对至少两个待处理文章进行筛选,包括:将文章质量得分大于第一设定阈值的待处理文章作为筛选结果,或者,将每个待处理文章的得分按照由高到低的顺序排列,将得分靠前的第一设定数量的待处理文章作为筛选结果;该方法还包括:发布或推送筛选出的待处理文章。在一种可选的实施方式中,文章质量通过待处理文章的文章质量得分表征,待处理文章为基于检索关键词检索到的文章;根据每个待处理文章的文章质量,对至少两个待处理文章进行筛选,包括:将文章质量得分大于第二设定阈值的待处理文章作为筛选结果,或者,将每个待处理文章的得分按照由高到低的顺序排列,将得分靠前的第二设定数量的待处理文章作为筛选结果;该方法还包括:将筛选出来的待处理文章提供给用户。本申请实施例的第三方面,提供了一种文章质量的确定装置,该装置包括:文章获取模块,用于获取关于同一话题的至少两个文章;文章质量确定模块,用于对于至少两个文章中待处理的目标文章,确定目标文章的质量评估参数,根据目标文章的质量评估参数确定目标文章的文章质量,其中,质量评估参数包括语义覆盖度和文章信息量,语义覆盖度是表征了目标文章和至少两个文章中除目标文章之外的其他文章的文章相关性。在一种可选的实施方式中,文章相关性包括语义相似度,文章质量确定模块在确定目标文章的语义覆盖度时,具体用于:分别确定目标文章与其他文章中每个文章的语义相似度;根据目标文章与其他文章中的每个文章的语义相似度,确定目标文章的语义覆盖度。在一种可选的实施方式中,文章质量确定模块在确定目标文章的文章信息量时,具体用于:提取目标文章的关键词,并确定各关键词的信息量;根据目标文章中各关键词的信息量,确定目标文章的文章信息量。在一种可选的实施方式中,关键词的信息量是指在至少两个文章中,关键词为文章提供的信息量。在一种可选的实施方式中,目标文章的文章质量通过目标文章的文章质量得分表征;文章质量确定模块在根据目标文章的质量评估参数确定目标文章的文章质量时,具体用于:获取语义覆盖度的第一权重和文章信息量的第二权重;根据语义覆盖度、文章信息量、第一权重、以及第二权重,确定目标文章的文章质量得分。在一种可选的实施方式中,目标文章的文章质量通过目标文章的文章质量得分表征,该装置还包括质量调节系数确定模块,该模块用于:获取目标文章的影响力评估参数;根据目标文章的影响力评估参数,确定目标文章的文章质量得分的调节系数;文章质量确定模块在根据目标文章的质量评估参数确定目标文章的文章质量时,具体用于:根据质量评估参数确定目标文章的初始质量得分;根据初始质量得分和调节系数,确定目标文章的文章质量得分。在一种可选的实施方式中,影响力评估参数包括以下至少一种:文章的原创性、用户对文章的操作行为信息、或者文章所对应的发布媒体的媒体等级。本申请实施例的第四方面,提供了一种文章筛选装置,该装置包括:获取模块,用于获取关于同一话题的至少两个待处理文章;文章质量确定模块,用于确定每个待处理文章的文章质量,其中,文章质量基于本申请实施例第一方面或第一方面的任一可选实施方式中所提供的文章质量的确定方法确定的;文章筛选模块,用于根据每个待处理文章的文章质量,对至少两个待处理文章进行筛选。在一种可选的实施方式中,文章质量通过待处理文章的文章质量得分表征,待处理文章为待发布文章或待推送文章,文章筛选模块具体用于:将文章质量得分大于第一设定阈值的待处理文章作为筛选结果,或者,将每个待处理文章的得分按照由高到低的顺序排列,将得分靠前的第一设定数量的待处理文章作为筛选结果;该装置还包括文章处理模块,该模块用于发布或推送筛选出的待处理文章。在一种可选的实施方式中,文章质量通过待处理文章的文章质量得分表征,待处理文章为基于检索关键词检索到的文章,文章筛选模块具体用于:将文章质量本文档来自技高网...

【技术保护点】
1.一种文章质量的确定方法,其特征在于,包括:获取关于同一话题的至少两个文章;对于所述至少两个文章中待处理的目标文章,确定所述目标文章的质量评估参数,其中,所述质量评估参数包括语义覆盖度和文章信息量,所述语义覆盖度表征了所述目标文章和所述至少两个文章中除所述目标文章之外的其他文章的文章相关性;根据所述目标文章的所述质量评估参数确定所述目标文章的文章质量。

【技术特征摘要】
1.一种文章质量的确定方法,其特征在于,包括:获取关于同一话题的至少两个文章;对于所述至少两个文章中待处理的目标文章,确定所述目标文章的质量评估参数,其中,所述质量评估参数包括语义覆盖度和文章信息量,所述语义覆盖度表征了所述目标文章和所述至少两个文章中除所述目标文章之外的其他文章的文章相关性;根据所述目标文章的所述质量评估参数确定所述目标文章的文章质量。2.根据权利要求1所述的方法,其特征在于,所述文章相关性包括语义相似度,确定所述目标文章的语义覆盖度,包括:分别确定所述目标文章与所述其他文章中每个文章的语义相似度;根据所述目标文章与所述其他文章中的每个文章的语义相似度,确定所述目标文章的语义覆盖度。3.根据权利要求1所述的方法,其特征在于,确定所述目标文章的文章信息量,包括:提取所述目标文章的关键词,并确定各所述关键词的信息量;根据所述目标文章中各所述关键词的信息量,确定所述目标文章的文章信息量。4.根据权利要求3所述的方法,其特征在于,所述关键词的信息量是指在所述至少两个文章中,所述关键词为所述文章提供的信息量。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述目标文章的文章质量通过所述目标文章的文章质量得分表征;所述根据所述目标文章的所述质量评估参数确定所述目标文章的文章质量,包括:获取所述语义覆盖度的第一权重和所述文章信息量的第二权重;根据所述语义覆盖度、所述文章信息量、所述第一权重、以及所述第二权重,确定所述目标文章的文章质量得分。6.根据权利要求1至4中任一项所述的方法,其特征在于,所述目标文章的文章质量通过所述目标文章的文章质量得分表征,所述方法还包括:获取所述目标文章的影响力评估参数;根据所述目标文章的影响力评估参数,确定所述目标文章的文章质量得分的调节系数;所述根据所述目标文章的所述质量评估参数确定所述目标文章的文章质量,包括:根据所述质量评估参数确定所述目标文章的初始质量得分;根据所述初始质量得分和所述调节系数,确定所述目标文章的文章质量得分。7.根据权利要求6所述的方法,其特征在于,所述影响力评估参数包括以下至少一种:文章的原创性、用户对文章的操作行为信息、或者文章所对应的发布媒体的媒体等级。8.一种文章筛选方法,其特征在于,包括:获取关于同一话题的至少两个待处理文章;确定每个所述待处理文章的文章质量,其中,所述文章质量是基于...

【专利技术属性】
技术研发人员:谭莲芝
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1