文章质量的评价方法及设备技术

技术编号:28421457 阅读:19 留言:0更新日期:2021-05-11 18:29
本发明专利技术实施例提供一种文章质量的评价方法及设备,方法包括:获取待处理文章以及待处理文章包括的至少两个文章部分;确定文章部分的文章表征信息、以及至少两个文章部分中任意两个文章部分之间的相似度表征信息;根据文章表征信息和相似度表征信息确定与待处理文章相对应的质量评价结果。通过获取待处理文章包括的至少两个文章部分,确定文章部分的文章表征信息和任意两个文章部分之间的相似度表征信息,根据文章表征信息和相似度表征信息确定待处理文章的质量评价结果,有效地实现了将待处理文章中各个文章部分之间的逻辑关系结合各文章部分的文章表征信息作为评价因素,来获得待处理文章的质量评价结果,从而可以提高文章质量评价的准确性。

【技术实现步骤摘要】
文章质量的评价方法及设备
本专利技术涉及计算机
,尤其涉及一种文章质量的评价方法及设备。
技术介绍
随着科学技术的飞速发展,文章的数字化处理已经成为一种流行趋势,例如,对文章进行数字化的质量评估,以获得文章的质量和价值。现有技术中,对文章进行质量评估的步骤包括:将文章划分为多个文章部分,对各个文章部分的文字内容进行质量评估,基于各个文章部分的质量评估结果获得整个文章的质量评估结果。然而,这种质量评估方式只是简单地对文章的各个文章部分进行识别处理,无法实现对文章的准确评估。
技术实现思路
本专利技术实施例提供了一种文章质量的评价方法及设备,可以将文章中包括的各个文章部分之间的逻辑关系结合各文章部分的文章表征信息作为评价因素,来获得文章的质量评价结果,从而可以提高文章质量评价的准确性。第一方面,本专利技术实施例提供一种文章质量的评价方法,包括:获取待处理文章以及所述待处理文章包括的至少两个文章部分;确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息;根据所述文章表征信息和相似度表征信息确定与所述待处理文章相对应的质量评价结果。第二方面,本专利技术实施例提供一种文章质量的评价设备,包括:第一获取模块,用于获取待处理文章以及所述待处理文章包括的至少两个文章部分;第一确定模块,用于确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息;第一评价模块,用于根据所述文章表征信息和相似度表征信息确定与所述待处理文章相对应的质量评价结果。第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面所述的文章质量的评价方法。第四方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第一方面所述的文章质量的评价方法。第五方面,本专利技术实施例提供一种用于评价文章质量的模型训练方法,包括:获取待训练文章以及所述待训练文章所对应的标准质量信息,所述待训练文章包括至少两个文章部分;确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息;基于所述文章表征信息、相似度标识信息和标准质量信息对全连接神经网络进行模型训练,获得用于评价文章质量的目标模型。第六方面,本专利技术实施例提供一种用于评价文章质量的模型训练设备,包括:第二获取模块,用于获取待训练文章以及所述待训练文章所对应的标准质量信息,所述待训练文章包括至少两个文章部分;第二确定模块,用于确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息;训练模块,用于基于所述文章表征信息、相似度标识信息和标准质量信息对全连接神经网络进行模型训练,获得用于评价文章质量的目标模型。第七方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第五方面所述的文章质量的评价方法。第八方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第五方面所述的文章质量的评价方法。第九方面,本专利技术实施例提供一种专利文件质量的评价方法,包括:获取待评价的专利文件以及所述专利文件包括的至少两个专利部分;确定所述专利部分的专利表征信息、以及至少两个所述专利部分中任意两个专利部分之间的相似度表征信息;根据所述专利表征信息和相似度表征信息确定与所述专利文件相对应的质量评价结果。第十方面,本专利技术实施例提供一种专利文件质量的评价设备,包括:第三获取模块,用于获取待评价的专利文件以及所述专利文件包括的至少两个专利部分;第三确定模块,用于确定所述专利部分的专利表征信息、以及至少两个所述专利部分中任意两个专利部分之间的相似度表征信息;第三评价模块,用于根据所述专利表征信息和相似度表征信息确定与所述专利文件相对应的质量评价结果。第十一方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第九方面所述的专利文件质量的评价方法。第十二方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第九方面所述的专利文件质量的评价方法。第十三方面,本专利技术实施例提供一种文章质量的评价方法,包括:获取待处理文章;获取用户针对所述待处理文章输入的执行操作,根据所述执行操作确定所述待处理文章中包括的至少两个文章部分;确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息;根据所述文章表征信息和相似度表征信息确定与所述待处理文章相对应的质量评价结果。第十四方面,本专利技术实施例提供一种文章质量的评价设备,包括:第四获取模块,用于获取待处理文章;所述第四获取模块,还用于获取用户针对所述待处理文章输入的执行操作,根据所述执行操作确定所述待处理文章中包括的至少两个文章部分;第四确定模块,用于确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息;第四评价模块,用于根据所述文章表征信息和相似度表征信息确定与所述待处理文章相对应的质量评价结果。第十五方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第十三方面所述的文章质量的评价方法。第十六方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第十三方面所述的文章质量的评价方法。通过获取待处理文章以及所述待处理文章包括的至少两个文章部分,确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息,而后根据所述文章表征信息和相似度表征信息确定与所述待处理文章相对应的质量评价结果,有效地实现了将待处理文章中包括的各个文章部分之间的逻辑关系结合各文章部分的文章表征信息作为评价因素,来获得待处理文章的质量评价结果,从而可以提高文章质量评价的准确性,有效地保证了该方法的实用性,有利于市场的推广与应用。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这本文档来自技高网...

【技术保护点】
1.一种文章质量的评价方法,包括:/n获取待处理文章以及所述待处理文章包括的至少两个文章部分;/n确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息;/n根据所述文章表征信息和相似度表征信息确定与所述待处理文章相对应的质量评价结果。/n

【技术特征摘要】
1.一种文章质量的评价方法,包括:
获取待处理文章以及所述待处理文章包括的至少两个文章部分;
确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息;
根据所述文章表征信息和相似度表征信息确定与所述待处理文章相对应的质量评价结果。


2.根据权利要求1所述的方法,确定所述文章部分的文章表征信息,包括:
获取所述文章部分包括的所有分词信息;
确定与所述分词信息相对应的词嵌入向量信息;
根据所述词嵌入向量信息确定所述文章部分的文章表征信息。


3.根据权利要求2所述的方法,确定所述文章部分的文章表征信息,包括:
根据所述文章部分中每个语句中分词信息所对应的词嵌入向量信息,确定每个所述语句的语句表征信息;
基于所述文章部分中所有语句的语句表征信息,确定所述文章部分的文章表征信息。


4.根据权利要求3所述的方法,确定每个所述语句的语句表征信息,包括:
将所述文章部分中每个语句中分词信息的词嵌入向量信息输入至第一分层注意力神经网络;
利用双向长短记忆网络算法和词嵌入向量信息获取每个所述语句的语句表征信息。


5.根据权利要求3所述的方法,确定所述文章部分的文章表征信息,包括:
基于所述文章部分中所有语句的语句表征信息输入至第二分层注意力神经网络;
利用双向长短记忆网络算法和语句表征信息获取所述文章部分的文章表征信息。


6.根据权利要求1-5中任意一项所述的方法,任意两个文章部分包括第一部分和第二部分;确定任意两个文章部分之间的相似度表征信息,包括:
获取所述第一部分包括的所有第一语句以及所述第二部分包括的所有第二语句;
确定所有第一语句与所有第二语句之间的相似度信息;
基于所述相似度信息确定所述第一部分与所述第二部分之间的相似度表征信息。


7.根据权利要求6所述的方法,确定所有第一语句与所有第二语句之间的相似度信息,包括:
利用相似度函数对所有第一语句和所有第二语句进行处理,获得所有第一语句与所有第二语句之间的相似度信息。


8.根据权利要求6所述的方法,确定所有第一语句与所有第二语句之间的相似度信息,包括:
确定与所述第一语句相对应的第一向量信息和与所述第二语句相对应的第二向量信息;
计算所述第一向量信息与所述第二向量信息之间的余弦相似度,并根据所述余弦相似度确定所述第一语句与所述第二语句之间的相似度信息。


9.根据权利要求6所述的方法,确定所述第一部分与所述第二部分之间的相似度表征信息,包括:
基于所述相似度信息确定所述第一部分中每个第一语句与所述第二部分中所有第二语句之间的第一最大相似度信息;
基于所述相似度信息确定所述第二部分中每个第二语句与所述第一部分中所有第一语句之间的第二最大相似度信息;
将所述第一最大相似度信息和所述第二最大相似度信息确定为所述相似度表征信息。


10.根据权利要求1-5中任意一项所述的方法,确定与所述待处理文章相对应的质量评价结果,包括:
根据所述文章表征信息和相似度表征信息确定目标表征信息;
利用全连接神经网络对所述目标表征信息进行处理,获得与所述待处理文章相对应的质量评价结果。


11.根据权利要求10所述的方法,利用全连接神经网络对所述目标表征信息进行处理,包括:
获取用于对所述待处理文章进行评价的评价等级;
利用所述全连接神经网络在每个评价等级上对所述目标表征信息进行处理,获得所述待处理文章在每个评价等级上相对应的评价信息;
根据所述评价信息确定所述待处理文章的目标评价等级。


12.根据权利要求11所述的方法,确定所述待处理文章的目标评价等级,包括:
将待处理文章在每个评价等级上相对应的评价信息转化为概率信息;
将所述概率信息最大的评价等级确定为所述待处理文章的目标评价等级。


13.根据权利要求11所述的方法,在确定与所述待处理文章相对应的质量评价结果之后,所述方法还包括:
获取待处理文章的实际评价等级;
确定所述实际评价等级与所述目标评价等级之间的交叉熵信息;
利用反向传播算法和所述交叉熵信息对全连接神经网络的网络参数进行更新调整。


14.根据权利要求11所述的方法,在确定与所述待处理文章相对应的质量评价结果之后,所述方法还包括:
获取文章查询请求;
确定与所述文章查询请求相对应的至少一个待推送文章;
获取所述待推送文章的质量评价结果;
基于所述质量评价结果,在至少一个待推送文章中确定与所述文章查询请求相对应的至少一个目标文章。


15.根据权利要求14所述的方法,基于所述质量评价结果,在至少一个待推送文章中确定与所述文章查询请求相对应的至少一个目标文章,包括:
根据所述质量评价结果确定至少一个待推送文章的质量优先级,所述质量优先级与所述质量评价结果呈正比;
根据所述质量优先级,在至少一个待推送文章中确定与所述文章查询请求相对应的至少一个目标文章。


16.一种用于评价文章质量的模型训练方法,包括:
获取待训练文章以及所述待训练文章所对应的标准质量信息,所述待训练文章包括至少两个文章部分;
确定所述文章部分的文章表征信息、以及至少两个所述文章部分中任意两个文章部分之间的相似度表征信息;
基于所述文章表征信息、相似度标识信息和标准质量信息对全连接神经网络进行模型训练,获得用于评价文章质量的目标模型。


17.根据权利要求16所述的方法,确定所述文章部分的文章表征信息,包括:
获取所述文章部分包括的所有分词信息;
确定与所述分词信息相对应的词嵌入向量信息;
根据所述词嵌入向量信息确定所述文章部分的文章表征信息。


18.根据权利要求17所述的方法,确定所述文章部分的文章表征信息,包括:
根据所述文章部分中每个语句中分词信息所对应的词嵌入向量信息,确定每个所述语句的语句表征信息;
基于所述文章部分中所有语句的语句表征信息,确定所述文章部分的文章表征信息。


19.根据权利要求18所述的方法,确定每个所述语句的语句表征信息,包括:
将所述文章部分中每个语句中分词信息的词嵌入向量信息输入至第一分层注意力神经网络;
利用双向长短记忆网络算法和词嵌入向量信息获取每个所述语句的语句表征信息。


20.根据权利要求18所述的方法,确定所述文章部分的文章表征信息,包括:
基于所述文章部分中所有语句的语句表征信息输入至第二分层注意力神经网络;
利用双向长短记忆网络算法和语句表征信息获取所述文章部分的文章表征信息。


21.根据权利要求16-20中任意一项所述的方法,任意两个文章部分包括第一部分和第二部分;确定任意两个文章部分之间的相似度表征信息,包括:
获取所述第一部分包括的所有第一语句以及所述第二部分包括的所有第二语句;
确定所有第一语句与所有第二语句之间的相似度信息;
基于所述相似度信息确定所述第一部分与所述第二部分之间的相似度表征信息。


22.根据权利要求21所述的方法,确定所有第一语句与所有第二语句之间的相似度信息,包括:
利用相似度函数对所有第一语句和所有第二语句进行处理,获得所有第一语句与所有第二语句之间的相似度信息。


23.根据权利要求21所述的方法,确定所有第一语句与所有第二语句之间的相似度信息,包括:
确定与所述第一语句相对应的第一向量信息和与所述第二语句相对应的第二向量信息;
计算所述第一向量信息与所述第二向量信息之间的余弦相似度,并根据所述余弦相似度确定所述第一语句与所述第二语句之间的相似度信息。


24.根据权利要求21所述的方法,确定所述第一部分与所述第二部分之间的相似度表征信息,包括:
基于所述相似度信息确定所述第一部分中每个第一语句与所述第二部分中所有第二语句之间的第一最大相似度信息;
基于所述相似度信息确定所述第二部分中每个第二语句与所述第一部分中所有第一语句之间的第二最大相似度信息;
将所述第一最大相似度信息和所述第二最大相似度信息确定为所述相似度表...

【专利技术属性】
技术研发人员:刘英箎李泉志张琼司罗
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1