一种基于知识图谱的领域机器翻译模型评价方法技术

技术编号:35482256 阅读:15 留言:0更新日期:2022-11-05 16:33
本发明专利技术公开了一种基于知识图谱的领域机器翻译模型评价方法,包括如下评价步骤:S1、首先获取待翻译的知识图谱数据,识别知识图谱中的知识图谱框架、逻辑关系和文字,S2、人工翻译知识图谱中的文字内容,并复制知识图谱框架、逻辑关系和翻译后的文字,组成翻译后的知识图谱,本发明专利技术通过对知识图谱的框架、逻辑关系和文字内容的划分,从而在不同的方面对知识图谱的翻译效果进行评价,先对框架和逻辑关系进行复制,统计其错误情况并处理,再对文字内容进行翻译,统计其错误情况,并对错误翻译进行重新翻译,能够使机器翻译的评价更加全面,且能够在翻译错误时快速了解知识图谱框架和逻辑关系的影响。关系的影响。关系的影响。

【技术实现步骤摘要】
一种基于知识图谱的领域机器翻译模型评价方法


[0001]本专利技术涉及机器翻译
,具体为一种基于知识图谱的领域机器翻译模型评价方法。

技术介绍

[0002]机器翻译,是利用计算机将一种语言转换为另一种语言的过程,机器翻译具有较强的实用价值,能够有力促进不同人之间的交流与合作,而对于知识图谱的翻译,往往不是简单的文字的转换,还包含有逻辑关系的复制和转换,知识图谱在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系;但是目前对于知识图谱的领域机器翻译模型的使用情况没有进行及时评价,难以对知识图谱的翻译进行提高,导致知识图谱领域机器翻译进步缓慢。

技术实现思路

[0003]本专利技术提供一种基于知识图谱的领域机器翻译模型评价方法,可以有效解决上述
技术介绍
中提出目前对于知识图谱的领域机器翻译模型的使用情况没有进行及时评价,难以对知识图谱的翻译进行提高,导致知识图谱领域机器翻译进步缓慢的问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种基于知识图谱的领域机器翻译模型评价方法,包括如下评价步骤:S1、首先获取待翻译的知识图谱数据,识别知识图谱中的知识图谱框架、逻辑关系和文字;S2、人工翻译知识图谱中的文字内容,并复制知识图谱框架、逻辑关系和翻译后的文字,组成翻译后的知识图谱;S3、将待翻译的知识图谱通过机器翻译模型进行翻译;S4、将机器翻译结果与人工翻译数据从知识图谱框架、逻辑关系和文字上进行对比;S5、对知识图谱框架和逻辑关系翻译错误的位置进行标记,再分析错误对整体知识图谱的影响;S6、统计文字部分翻译的正确、近似和错误情况;S7、将文字翻译错误位置前后文字代入重新翻译,再次统计翻译错误的情况;S8、根据统计的错误数据,进行综合评价。
[0005]根据上述技术方案,所述S1中,在识别知识图谱框架中的逻辑关系时,先由高到低确定文字所属关系层级,再确定相邻层级文字的逻辑关系,以及相同层级文字的逻辑关系。
[0006]根据上述技术方案,所述S2中,在翻译知识图谱中的文字内容时,先对层级最高的文字进行翻译,然后再对下一层级的文字进行翻译,每翻译一个层级代入上一层级进行层
级翻译检查,确定上下层级文字的翻译符合上下层级关系。
[0007]根据上述技术方案,所述S3中,通过机器翻译知识图谱时,先对文字所在的位置进行记录,文字翻译后根据记录的位置将翻译后的文字放置在对应的位置处,形成完整的知识图谱。
[0008]根据上述技术方案,所述S4中,对比时,先对比知识图谱框架、再对比逻辑关系,最后对比文字;逻辑关系的对比在知识图谱正确的前提下进行,文字的对比在逻辑关系正确的前提下进行。
[0009]根据上述技术方案,所述S5中,知识图谱框架的错误包括分支个数和分支位置,逻辑关系的错误包括关系倒置、关系矛盾和关系混淆;所述错误的知识框架和逻辑关系对整体知识图谱的影响通过错误内容占全部内容的百分比表示。
[0010]根据上述技术方案,所述S6中,将机器翻译的文字与人工翻译的文字进行对比,统计机器翻译的正确数量、近似数量和错误数量;所述文字翻译正确为机器翻译与人工翻译完全一致;所述文字翻译近似为机器翻译与人工翻译文字不同但词义相近;所述文字翻译错误为机器翻译与人工翻译文字和词义均不同。
[0011]根据上述技术方案,所述S7中,重新翻译后,将翻译结果中错误数量进行记录,并计算重新翻译的错误数量。
[0012]根据上述技术方案,所述S8中,分别统计知识图谱框架错误比例、逻辑关系错误比例、文字翻译正确数量、文字翻译近似数量、文字翻译错误数量和重新翻译错误百分比。
[0013]根据上述技术方案,所述S8中,综合评价通过等级表示:一级:知识图谱框架错误比例和逻辑关系错误比例和文字翻译错误数量均为0;二级:知识图谱框架错误比例和逻辑关系错误比例均为0,且文字翻译正确数量大于等于文字翻译近似数量,文字翻译错误数量小于等于1;三级:知识图谱框架错误比例和逻辑关系错误比例均小于等于1%,且文字翻译正确数量大于等于文字翻译近似数量,文字翻译错误数量小于等于3,重新翻译错误数量为0;四级:剩余其他情况。
[0014]与现有技术相比,本专利技术的有益效果:1、通过对知识图谱的框架、逻辑关系和文字内容的划分,从而在不同的方面对知识图谱的翻译效果进行评价,先对框架和逻辑关系进行复制,统计其错误情况并处理,再对文字内容进行翻译,统计其错误情况,并对错误翻译进行重新翻译,能够使机器翻译的评价更加全面,且能够在翻译错误时快速了解知识图谱框架和逻辑关系的影响。
[0015]2、通过将不同翻译结果划分等级,将框架、逻辑关系和文字内容均没有错误的划分为一级,将框架和逻辑关系没有错误,文字内容有少量错误的划分为二级,将框架、逻辑关系和文字内容均有少量错误,重新翻译后没有错误的划分为三级,剩余情况划分为四级,从而能够直观的了解机器翻译的评价结果。
附图说明
[0016]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。
[0017]在附图中:图1是本专利技术机器翻译模型评价的步骤图;图2是本专利技术的知识图谱的层级划分示意图。
具体实施方式
[0018]以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0019]实施例1:如图1

2所示,本专利技术提供一种技术方案,一种基于知识图谱的领域机器翻译模型评价方法,包括如下评价步骤:S1、首先获取待翻译的知识图谱数据,识别知识图谱中的知识图谱框架、逻辑关系和文字;S2、人工翻译知识图谱中的文字内容,并复制知识图谱框架、逻辑关系和翻译后的文字,组成翻译后的知识图谱;S3、将待翻译的知识图谱通过机器翻译模型进行翻译;S4、将机器翻译结果与人工翻译数据从知识图谱框架、逻辑关系和文字上进行对比;S5、对知识图谱框架和逻辑关系翻译错误的位置进行标记,再分析错误对整体知识图谱的影响;S6、统计文字部分翻译的正确、近似和错误情况;S7、将文字翻译错误位置前后文字代入重新翻译,再次统计翻译错误的情况;S8、根据统计的错误数据,进行综合评价。
[0020]根据上述技术方案,S1中,在识别知识图谱框架中的逻辑关系时,先由高到低确定文字所属关系层级,再确定相邻层级文字的逻辑关系,以及相同层级文字的逻辑关系。
[0021]根据上述技术方案,S2中,在翻译知识图谱中的文字内容时,先对层级最高的文字进行翻译,然后再对下一层级的文字进行翻译,每翻译一个层级代入上一层级进行层级翻译检查,确定上下层级文字的翻译符合上下层级关系。
[0022]根据上述技术方案,S3中,通过机器翻译知识图谱时,先对文字所在的位置进行记录,文字翻译后根据记录的位置将本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的领域机器翻译模型评价方法,其特征在于:包括如下评价步骤:S1、首先获取待翻译的知识图谱数据,识别知识图谱中的知识图谱框架、逻辑关系和文字;S2、人工翻译知识图谱中的文字内容,并复制知识图谱框架、逻辑关系和翻译后的文字,组成翻译后的知识图谱;S3、将待翻译的知识图谱通过机器翻译模型进行翻译;S4、将机器翻译结果与人工翻译数据从知识图谱框架、逻辑关系和文字上进行对比;S5、对知识图谱框架和逻辑关系翻译错误的位置进行标记,再分析错误对整体知识图谱的影响;S6、统计文字部分翻译的正确、近似和错误情况;S7、将文字翻译错误位置前后文字代入重新翻译,再次统计翻译错误的情况;S8、根据统计的错误数据,进行综合评价。2.根据权利要求1所述的一种基于知识图谱的领域机器翻译模型评价方法,其特征在于,所述S1中,在识别知识图谱框架中的逻辑关系时,先由高到低确定文字所属关系层级,再确定相邻层级文字的逻辑关系,以及相同层级文字的逻辑关系。3.根据权利要求1所述的一种基于知识图谱的领域机器翻译模型评价方法,其特征在于,所述S2中,在翻译知识图谱中的文字内容时,先对层级最高的文字进行翻译,然后再对下一层级的文字进行翻译,每翻译一个层级代入上一层级进行层级翻译检查,确定上下层级文字的翻译符合上下层级关系。4.根据权利要求1所述的一种基于知识图谱的领域机器翻译模型评价方法,其特征在于,所述S3中,通过机器翻译知识图谱时,先对文字所在的位置进行记录,文字翻译后根据记录的位置将翻译后的文字放置在对应的位置处,形成完整的知识图谱。5.根据权利要求1所述的一种基于知识图谱的领域机器翻译模型评价方法,其特征在于,所述S4中,对比时,先对比知识图谱框架、再对比逻辑关系,最后对比文字;逻辑关系的对比在知识图谱正确的前提下进行...

【专利技术属性】
技术研发人员:徐鑫刘文海李疏
申请(专利权)人:南京莱科智能工程研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1