【技术实现步骤摘要】
一种模型生成文本的评估方法及计算机设备
[0001]本申请属于文献数据深加工
,特别是涉及一种模型生成文本的评估方法及计算机设备。
技术介绍
[0002]专利深加工是针对专利文献特点利用文本生成技术获取高附加值的专利改写技术。目前,专利深加工主要包括名称深加工、摘要深加工、关键词标引、IPC分类等,专利摘要深加工即专利摘要改写,将长文本输入训练好的模型,生成摘要文本(模型生成文本)。因此,有必要执行合适的评估,为模型生成文本提供一个客观、统一、量化的衡量标准。
[0003]早期的模型生成文本评估采用信息检索的指标,如召回率、精度和F值,将模型生成文本与人工撰写的文本进行比较,并测量它们之间的共同内容。这种传统的评估方法存在的主要问题是,将模型生成文本与单个人工编写的文本进行比较过于主观。
[0004]目前,开发摘要系统所依赖的标准度量通常是ROUGE和BLEU。BLEU(英文全称:bilingual evaluation understudy,中文术语:双语评估候补)主要任务是将模型译文的n元语法单元与参考译文(即人工撰写译文)的n元语法单元进行比较,并计算匹配的次数,这些匹配是位置无关的,匹配越多,模型译文越好。ROUGE(英文全称:Recall
‑
Oriented Understudy for Gisting Evaluation,中文术语:面向召回的突出重点的评估替补)将模型生成文本与标签,即人工撰写文本,进行比较,计算模型生成的要评估的文本和人类撰写的理想文本之间重叠单 ...
【技术保护点】
【技术特征摘要】
1.一种模型生成文本的评估方法,其特征在于,包括:对于待评估的模型生成文本,分别计算其基因指标、可读性指标以及指纹指标;所述基因指标用于衡量模型生成文本与输入文本的语义相关性和同源情况,包括文本长度、相关度和互信息等三个因素;其中,相关度基于词频和皮尔逊相关系数设计实现,互信息表征模型生成文本与输入文本之间的依赖程度;所述可读性指标用于从标点切分出的句子长度均值和文本重复退化情况来衡量模型生成文本能被人读懂的程度;所述指纹指标用于衡量模型生成文本与训练集标签的语义特征分布一致程度;具体预先基于三元孪生网络训练指纹提取网络模型,同时生成指纹库,然后通过将模型生成文本输入所述指纹提取网络模型得到指纹,再与所述指纹库进行距离度量,确定指纹指标的值;基于计算得到的基因指标、可读性指标和指纹指标的值,进行综合评估,得到最终的评估结果。2.根据权利要求1所述的模型生成文本的评估方法,其特征在于,所述基因指标的公式如下:;式中:V
gene
表示基因指标值;len
candidate
表示模型生成文本的字符个数;corr表示模型生成文本与输入文本的相关度;mi表示模型生成文本与输入文本的互信息。3.根据权利要求1所述的模型生成文本的评估方法,其特征在于,所述可读性指标的公式如下:;式中:V
read
为可读性指标的值;Total
sent
表示模型生成文本的句子数,句子指利用标点分割获取的字符串;Total
char
表示模型生成文本的字符数,标点除外;Total
dup
表示出现重复的次数;len
generate
表示文本的长度。4.根据权利要求1所述的模型生成文本的评估方法,其特征在于,所述基于三元孪生网络训练指纹提取网络模型,同时生成指纹库,具体包括:首先,对数据集进行预处理,构建原始标签、副本标签和无关标签三个数据集;其次,构建三个共享权重参数的网络,分别输入所述原始标签、副本标签和无关标签三个数据集;再次,根据三元组损失和分类损失更新网络参数,并获得训练集标签指纹库。5.根据权利要求4所述的模型生成文本的评估方法,其特征在于,三元组损失函数L
tr
为:;式中:N表示三元文本组的总数;max( , )表示取大值;D( , )表示计算欧几里得距离;x
f
、和分别表示、和经过网络映射得到的特征;margin表示三元组损失函...
【专利技术属性】
技术研发人员:冯好国,徐青伟,严长春,裴非,范娥媚,
申请(专利权)人:知呱呱天津大数据技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。