【技术实现步骤摘要】
一种摘要评价方法及装置
本专利技术主要涉及语言处理
,具体涉及一种摘要评价方法及装置。
技术介绍
在自然语言处理中,文本摘要是该领域中的热点研究方向,文本摘要包括抽取式和生成式摘要,抽取式摘要通过抽取算法在原文中抽取重要的语句组成摘要,而生成式摘要则通过大量的预料来训练模型使得模型具有生成摘要的能力。近年来摘要已经取得了不错的发展,但摘要的评价标准却发展缓慢,摘要的评价标准包括内部评价和外部评价,外部评价是利用提取的摘要参与一些任务例如文档检索等进而判断摘要的优劣;而内部评价是判断系统摘要与参考摘要之间的信息重合度判断摘要的质量。例如ROUGE评价和BLUE评价都是内部评价,这种评价方法的优点是稳定性和健壮性,但这种评价方法的缺点是未考虑到待评价语句的深层语义,当待评价句子之间的共现信息较少时而句子内部的深层语义相同时,这种评价方法不合理。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的不足,提供一种摘要评价方法及装置。本专利技术解决上述技术问题的技术方案如下:一种摘要评 ...
【技术保护点】
1.一种摘要评价方法,其特征在于,包括如下步骤:/n录入摘要信息和原文信息,将所述摘要信息和原文信息作为待评价语句信息;/n将所述待评价语句信息输入预先构建的语义相似模型中进行语义相似度处理,得到语义相似度得分;/n对所述待评价语句信息进行评价得分处理,得到ROUGE得分;/n根据所述语义相似度得分对所述ROUGE得分进行最优融合分析,得到最优融合组;/n对所述最优融合组进行融合分数计算,得到最优融合分数,并通过所述最优融合分数得到摘要评价分数。/n
【技术特征摘要】
1.一种摘要评价方法,其特征在于,包括如下步骤:
录入摘要信息和原文信息,将所述摘要信息和原文信息作为待评价语句信息;
将所述待评价语句信息输入预先构建的语义相似模型中进行语义相似度处理,得到语义相似度得分;
对所述待评价语句信息进行评价得分处理,得到ROUGE得分;
根据所述语义相似度得分对所述ROUGE得分进行最优融合分析,得到最优融合组;
对所述最优融合组进行融合分数计算,得到最优融合分数,并通过所述最优融合分数得到摘要评价分数。
2.根据权利要求1所述的摘要评价方法,其特征在于,所述得到语义相似度得分的过程包括:
构建LSTM长短时记忆网络,并根据所述LSTM长短时记忆网络对所述待评价语句信息进行编码,得到编码信息;
对所述编码信息进行选择门挑选计算,得到关键信息向量;
将所述关键信息向量输入至所述语义相似模型的匹配层进行信息匹配处理,得到两个匹配向量;
将两个所述匹配向量一并输入至所述语义相似模型的融合层进行融合处理,得到融合向量;
将所述融合向量输入至所述语义相似模型的预测层进行预测处理,得到得到语义相似度得分。
3.根据权利要求2所述的摘要评价方法,其特征在于,所述得到关键信息向量的过程包括:
通过第一方程组对所述编码信息进行选择门挑选计算,得到关键信息向量,所述第一方程组为:
s=hn,
sGatei=σ(Wshi+Uss+b),
其中,s为句向量,hn为隐藏层中第n个向量,n为隐藏层中向量数,hi为隐藏层中第i个向量,sGatei为选择系数,h'i为关键信息向量,Ws为权重矩阵,Us为偏置向量,b为任意一个句子上下文向量,σ为sigmoid激活函数,为元素之间的点乘。
4.根据权利要求1所述的摘要评价方法,其特征在于,所述得到ROUGE得分的过程包括:
利用ROUGE算法对所述待评价语句信息进行评价得分处理,得到ROUGE得分。
5.根据权利要求4所述的摘要评价方法,其特征在于,所述得到最优融合组的过程包括:
根据所述语义相似度得分对所述ROUGE得分进行置信距离计算,得到置信距离矩阵;
对所述置信距离矩阵进行关系矩阵计算,得到关系矩阵,所述关系矩阵包括多个1和多个0;
对所述多个1的数量进行统计,得到关系矩阵1的数量,根据统计出的所述关系矩阵1的数量得到关系矩阵第一数量;
对所述多个0的数量进行统计,得到关系矩阵0的数量,根据统计出的所述关系矩阵0的数量得到关系矩阵第二数量;
当所述关系矩阵第一数量大于等于所述关系矩阵第二数量时,则得到最优融合组。
6.根据权利要求5所述的摘要评价方法,其特征在于,所述根据所述语义相似度得分对所述ROUGE得分进行置信距离计算,得到置信距离矩阵的过程包括:
通过第一式对所述语义相似度得分和所述ROUGE得分进行置信距离计算,得到置信距离矩阵,所述第一式为:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。