The invention discloses a word polysemy translation method based on artificial intelligence knowledge atlas. The specific working steps include: 1) coding the target text; 2) using punctuation mark splitting method to Clause the target text; 3) using word splitting and part-of-speech marking tools to segment and word the target text after Clause 2). Sex tagging; 4) lexical dependency and clustering analysis tools are used to analyze the dependency and clustering of words with special parts of speech on the basis of segmentation and part-of-speech tagging in step 3; 5) weighting index is introduced to generate knowledge map and calculate the weighting value of knowledge map on the basis of step 4; 6) knowledge map established by step 5 To determine the most appropriate translation options, the spectrum is compared with the specialized terminology Library of different domains involved in polysemous words. Through the above method, the invention provides a method of polysemy translation based on artificial intelligence knowledge atlas, which can improve the accuracy of polysemy translation.
【技术实现步骤摘要】
一种基于人工智能知识图谱的一词多义翻译方法
本专利技术涉及一种翻译方法,尤其是涉及一种基于人工智能知识图谱的一词多义翻译方法。
技术介绍
在翻译过程中,经常遇到一词多义,一词在不同专业背景下有不同翻译称谓和解读的情况,通常需要人工干预完成翻译,成为机器翻译质量保证的一个瓶颈,同时,因为人工干预译员水平不同,经常导致一词多义翻译失真不准确,无法保证翻译质量,带来损失。目前国内外翻译软件平台通常采用调用多个行业术语库,把翻译匹配结果全部罗列出来供译员选择,或者根据译文使用频率调整翻译提示的顺序,都没有一个很好的解决,依赖人工干预,较多的翻译选项降低了翻译处理效率,也增加了信息干扰和数据冗余,使得翻译品质无法保障。
技术实现思路
本专利技术主要解决的技术问题是提供一种基于人工智能知识图谱的一词多义翻译方法,能够大幅度提高一词多义翻译的准确性。为解决上述技术问题,本专利技术采用的一个技术方案是:一种基于人工智能知识图谱的一词多义翻译方法,具体工作步骤包括:1)对目标文本进行编码处理,统一为标准字符;2)采用标点符号拆分方法对目标文本进行分句;3)采用分词与词性标注工具对步骤2)分句后的目标文本进行分词与词性标注;4)采用词汇依存与聚类分析工具在步骤3)所完成的分词与词性标注的基础上对具有特殊词性的词语进行依存与聚类分析;5)在步骤4)的基础上引入权重指数,生成知识图谱并计算知识图谱权重值;6)将步骤5)建立的知识图谱与一词多义的词汇所涉及的不同领域专业术语库进行图谱比对,确定最合适的翻译选项。在本专利技术一个较佳实施例中,所述步骤1)中统一标准字符的标准号为GB231 ...
【技术保护点】
1.一种基于人工智能知识图谱的一词多义翻译方法,其特征在于:具体工作步骤包括:1)对目标文本进行编码处理,统一为标准字符;2)采用标点符号拆分方法对目标文本进行分句;3)采用分词与词性标注工具对步骤2)分句后的目标文本进行分词与词性标注;4)采用词汇依存与聚类分析工具在步骤3)所完成的分词与词性标注的基础上对具有特殊词性的词语进行依存与聚类分析;5)在步骤4)的基础上引入权重指数,生成知识图谱并计算知识图谱权重值;6)将步骤5)建立的知识图谱与一词多义的词汇所涉及的不同领域专业术语库进行图谱比对,确定最合适的翻译选项。
【技术特征摘要】
1.一种基于人工智能知识图谱的一词多义翻译方法,其特征在于:具体工作步骤包括:1)对目标文本进行编码处理,统一为标准字符;2)采用标点符号拆分方法对目标文本进行分句;3)采用分词与词性标注工具对步骤2)分句后的目标文本进行分词与词性标注;4)采用词汇依存与聚类分析工具在步骤3)所完成的分词与词性标注的基础上对具有特殊词性的词语进行依存与聚类分析;5)在步骤4)的基础上引入权重指数,生成知识图谱并计算知识图谱权重值;6)将步骤5)建立的知识图谱与一词多义的词汇所涉及的不同领域专业术语库进行图谱比对,确定最合适的翻译选项。2.根据权利要求1所述的一种基于人工智能知识图谱的一词多义翻译方法,其特征在于,所述步骤1)中统一标准字符的标准号为GB2312—1980以及UnicodeUTF8,UTF16字符编码标准。3.根据权利要求1所述的一种基于人工智能知识图谱的一词多义翻译方法,其特征在于,所述步骤2)中标点符号拆分方法遵循国家标准(GB/T15834-2011)《标点符号用法》。4.根据权利要求1所述的一种基于人工智能知识图谱的一词多义翻译方法,其特征在于,所述步骤3)中分词与词性标注工具为中科院自动化研究所模式识别国家重点实验室的Urheen中文分词与词性标注系统。5.根据权利要求...
【专利技术属性】
技术研发人员:邓耀臣,彭韡铭,申明磊,
申请(专利权)人:常熟鑫沐奇宝软件开发有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。