文章质量的评价方法及设备技术

技术编号：28421457 阅读：19 留言：0更新日期：2021-05-11 18:29

本发明专利技术实施例提供一种文章质量的评价方法及设备，方法包括：获取待处理文章以及待处理文章包括的至少两个文章部分；确定文章部分的文章表征信息、以及至少两个文章部分中任意两个文章部分之间的相似度表征信息；根据文章表征信息和相似度表征信息确定与待处理文章相对应的质量评价结果。通过获取待处理文章包括的至少两个文章部分，确定文章部分的文章表征信息和任意两个文章部分之间的相似度表征信息，根据文章表征信息和相似度表征信息确定待处理文章的质量评价结果，有效地实现了将待处理文章中各个文章部分之间的逻辑关系结合各文章部分的文章表征信息作为评价因素，来获得待处理文章的质量评价结果，从而可以提高文章质量评价的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
文章质量的评价方法及设备
本专利技术涉及计算机
，尤其涉及一种文章质量的评价方法及设备。
技术介绍
随着科学技术的飞速发展，文章的数字化处理已经成为一种流行趋势，例如，对文章进行数字化的质量评估，以获得文章的质量和价值。现有技术中，对文章进行质量评估的步骤包括：将文章划分为多个文章部分，对各个文章部分的文字内容进行质量评估，基于各个文章部分的质量评估结果获得整个文章的质量评估结果。然而，这种质量评估方式只是简单地对文章的各个文章部分进行识别处理，无法实现对文章的准确评估。
技术实现思路
本专利技术实施例提供了一种文章质量的评价方法及设备，可以将文章中包括的各个文章部分之间的逻辑关系结合各文章部分的文章表征信息作为评价因素，来获得文章的质量评价结果，从而可以提高文章质量评价的准确性。第一方面，本专利技术实施例提供一种文章质量的评价方法，包括：获取待处理文章以及所述待处理文章包括的至少两个文章部分；确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息；根据所述文章表征信息和相似度表征信息确定与所述待处理文章相对应的质量评价结果。第二方面，本专利技术实施例提供一种文章质量的评价设备，包括：第一获取模块，用于获取待处理文章以及所述待处理文章包括的至少两个文章部分；第一确定模块，用于确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息；第一评价模块，用于根...

【技术保护点】
1.一种文章质量的评价方法，包括：/n获取待处理文章以及所述待处理文章包括的至少两个文章部分；/n确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息；/n根据所述文章表征信息和相似度表征信息确定与所述待处理文章相对应的质量评价结果。/n

【技术特征摘要】
1.一种文章质量的评价方法，包括：
获取待处理文章以及所述待处理文章包括的至少两个文章部分；
确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息；
根据所述文章表征信息和相似度表征信息确定与所述待处理文章相对应的质量评价结果。

2.根据权利要求1所述的方法，确定所述文章部分的文章表征信息，包括：
获取所述文章部分包括的所有分词信息；
确定与所述分词信息相对应的词嵌入向量信息；
根据所述词嵌入向量信息确定所述文章部分的文章表征信息。

3.根据权利要求2所述的方法，确定所述文章部分的文章表征信息，包括：
根据所述文章部分中每个语句中分词信息所对应的词嵌入向量信息，确定每个所述语句的语句表征信息；
基于所述文章部分中所有语句的语句表征信息，确定所述文章部分的文章表征信息。

4.根据权利要求3所述的方法，确定每个所述语句的语句表征信息，包括：
将所述文章部分中每个语句中分词信息的词嵌入向量信息输入至第一分层注意力神经网络；
利用双向长短记忆网络算法和词嵌入向量信息获取每个所述语句的语句表征信息。

5.根据权利要求3所述的方法，确定所述文章部分的文章表征信息，包括：
基于所述文章部分中所有语句的语句表征信息输入至第二分层注意力神经网络；
利用双向长短记忆网络算法和语句表征信息获取所述文章部分的文章表征信息。

6.根据权利要求1-5中任意一项所述的方法，任意两个文章部分包括第一部分和第二部分；确定任意两个文章部分之间的相似度表征信息，包括：
获取所述第一部分包括的所有第一语句以及所述第二部分包括的所有第二语句；
确定所有第一语句与所有第二语句之间的相似度信息；
基于所述相似度信息确定所述第一部分与所述第二部分之间的相似度表征信息。

7.根据权利要求6所述的方法，确定所有第一语句与所有第二语句之间的相似度信息，包括：
利用相似度函数对所有第一语句和所有第二语句进行处理，获得所有第一语句与所有第二语句之间的相似度信息。

8.根据权利要求6所述的方法，确定所有第一语句与所有第二语句之间的相似度信息，包括：
确定与所述第一语句相对应的第一向量信息和与所述第二语句相对应的第二向量信息；
计算所述第一向量信息与所述第二向量信息之间的余弦相似度，并根据所述余弦相似度确定所述第一语句与所述第二语句之间的相似度信息。

9.根据权利要求6所述的方法，确定所述第一部分与所述第二部分之间的相似度表征信息，包括：
基于所述相似度信息确定所述第一部分中每个第一语句与所述第二部分中所有第二语句之间的第一最大相似度信息；
基于所述相似度信息确定所述第二部分中每个第二语句与所述第一部分中所有第一语句之间的第二最大相似度信息；
将所述第一最大相似度信息和所述第二最大相似度信息确定为所述相似度表征信息。

10.根据权利要求1-5中任意一项所述的方法，确定与所述待处理文章相对应的质量评价结果，包括：
根据所述文章表征信息和相似度表征信息确定目标表征信息；
利用全连接神经网络对所述目标表征信息进行处理，获得与所述待处理文章相对应的质量评价结果。

11.根据权利要求10所述的方法，利用全连接神经网络对所述目标表征信息进行处理，包括：
获取用于对所述待处理文章进行评价的评价等级；
利用所述全连接神经网络在每个评价等级上对所述目标表征信息进行处理，获得所述待处理文章在每个评价等级上相对应的评价信息；
根据所述评价信息确定所述待处理文章的目标评价等级。

12.根据权利要求11所述的方法，确定所述待处理文章的目标评价等级，包括：
将待处理文章在每个评价等级上相对应的评价信息转化为概率信息；
将所述概率信息最大的评价等级确定为所述待处理文章的目标评价等级。

13.根据权利要求11所述的方法，在确定与所述待处理文章相对应的质量评价结果之后，所述方法还包括：
获取待处理文章的实际评价等级；
确定所述实际评价等级与所述目标评价等级之间的交叉熵信息；
利用反向传播算法和所述交叉熵信息对全连接神经网络的网络参数进行更新调整。

14.根据权利要求11所述的方法，在确定与所述待处理文章相对应的质量评价结果之后，所述方法还包括：
获取文章查询请求；
确定与所述文章查询请求相对应的至少一个待推送文章；
获取所述待推送文章的质量评价结果；
基于所述质量评价结果，在至少一个待推送文章中确定与所述文章查询请求相对应的至少一个目标文章。

15.根据权利要求14所述的方法，基于所述质量评价结果，在至少一个待推送文章中确定与所述文章查询请求相对应的至少一个目标文章，包括：
根据所述质量评价结果确定至少一个待推送文章的质量优先级，所述质量优先级与所述质量评价结果呈正比；
根据所述质量优先级，在至少一个待推送文章中确定与所述文章查询请求相对应的至少一个目标文章。

16.一种用于评价文章质量的模型训练方法，包括：
获取待训练文章以及所述待训练文章所对应的标准质量信息，所述待训练文章包括至少两个文章部分；
确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息；
基于所述文章表征信息、相似度标识信息和标准质量信息对全连接神经网络进行模型训练，获得用于评价文章质量的目标模型。

17.根据权利要求16所述的方法，确定所述文章部分的文章表征信息，包括：
获取所述文章部分包括的所有分词信息；
确定与所述分词信息相对应的词嵌入向量信息；
根据所述词嵌入向量信息确定所述文章部分的文章表征信息。

18.根据权利要求17所述的方法，确定所述文章部分的文章表征信息，包括：
根据所述文章部分中每个语句中分词信息所对应的词嵌入向量信息，确定每个所述语句的语句表征信息；
基于所述文章部分中所有语句的语句表征信息，确定所述文章部分的文章表征信息。

19.根据权利要求18所述的方法，确定每个所述语句的语句表征信息，包括：
将所述文章部分中每个语句中分词信息的词嵌入向量信息输入至第一分层注意力神经网络；
利用双向长短记忆网络算法和词嵌入向量信息获取每个所述语句的语句表征信息。

20.根据权利要求18所述的方法，确定所述文章部分的文章表征信息，包括：
基于所述文章部分中所有语句的语句表征信息输入至第二分层注意力神经网络；
利用双向长短记忆网络算法和语句表征信息获取所述文章部分的文章表征信息。

21.根据权利要求16-20中任意一项所述的方法，任意两个文章部分包括第一部分和第二部分；确定任意两个文章部分之间的相似度表征信息，包括：
获取所述第一部分包括的所有第一语句以及所述第二部分包括的所有第二语句；
确定所有第一语句与所有第二语句之间的相似度信息；
基于所述相似度信息确定所述第一部分与所述第二部分之间的相似度表征信息。

22.根据权利要求21所述的方法，确定所有第一语句与所有第二语句之间的相似度信息，包括：
利用相似度函数对所有第一语句和所有第二语句进行处理，获得所有第一语句与所有第二语句之间的相似度信息。

23.根据权利要求21所述的方法，确定所有第一语句与所有第二语句之间的相似度信息，包括：
确定与所述第一语句相对应的第一向量信息和与所述第二语句相对应的第二向量信息；
计算所述第一向量信息与所述第二向量信息之间的余弦相似度，并根据所述余弦相似度确定所述第一语句与所述第二语句之间的相似度信息。

24.根据权利要求21所述的方法，确定所述第一部分与所述第二部分之间的相似度表征信息，包括：
基于所述相似度信息确定所述第一部分中每个第一语句与所述第二部分中所有第二语句之间的第一最大相似度信息；
基于所述相似度信息确定所述第二部分中每个第二语句与所述第一部分中所有第一语句之间的第二最大相似度信息；
将所述第一最大相似度信息和所述第二最大相似度信息确定为所述相似度表...

【专利技术属性】
技术研发人员：刘英箎，李泉志，张琼，司罗，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人