The present disclosure relates to a method for generating translated text, a device for generating translated text and a program for generating translated text. The methods of generating the translated corpus include: acquiring the first text of the first language, translating the first text into the second language, the second text of the first language, and the second translation from the second language; generating the second conjunction of the first translation and the second translation using the second language into a sentence. The resulting third translation is used as the translation of the first and second text using the first conjunction of the first language as a sentence.
【技术实现步骤摘要】
翻译文生成方法、翻译文生成装置以及翻译文生成程序
本公开涉及生成在第1语言与第2语言之间的翻译处理中使用的翻译文的翻译文生成方法、翻译文生成装置以及翻译文生成程序。
技术介绍
近年来,正在研究和开发将第1语言的语句(文)翻译成与第1语言不同的第2语言的语句的机器翻译装置,要提高这种机器翻译装置的翻译性能,需要收集有大量的可利用于翻译的例文(例句)的对译语料库(Corpus)。尤其是,以往的机器翻译装置难以进行长文(长句)或者复句的翻译。例如在专利文献1中公开了如下方法:将输入文本进行分割,按每个分割出的文本进行翻译,由此高精度地翻译长文。另外,在专利文献2中,公开了通过自动地生成多样的同一意图的相似文从而大量地收集话语文例。现有技术文献专利文献1:日本特开2006-18354号公报专利文献2:日本特开2015-118498号公报
技术实现思路
专利技术所要解决的问题然而,在上述以往的技术中,没有考虑收集将多个文(语句)用连词(接续词)相互连接而得到的长文的对译语料库,需要进一步的改善。本公开是解决上述以往的问题而做出的,其目的在于提供能够使将多个文用连词相互连接而得到的长文的翻译性能提高的翻译文生成方法、翻译文生成装置以及翻译文生成程序。用于解决问题的技术方案本公开的一个技术方案涉及的翻译文生成方法,是翻译文生成装置中的翻译文生成方法,所述翻译文生成装置生成在第1语言与第2语言之间的翻译处理中使用的翻译文,所述翻译文生成方法包括:取得所述第1语言的第1文、将该第1文翻译成所述第2语言而得到的第1翻译文、所述第1语言的第2文、和将该第2文翻译成所述第2语言而得到 ...
【技术保护点】
1.一种翻译文生成方法,是翻译文生成装置中的翻译文生成方法,所述翻译文生成装置生成在第1语言与第2语言之间的翻译处理中使用的翻译文,所述翻译文生成方法包括:取得所述第1语言的第1文、将该第1文翻译成所述第2语言而得到的第1翻译文、所述第1语言的第2文、和将该第2文翻译成所述第2语言而得到的第2翻译文,生成将所述第1翻译文和所述第2翻译文使用所述第2语言的第2连词构成为一个文句而得到的第3翻译文来作为将所述第1文和所述第2文使用所述第1语言的第1连词构成为一个文句而得到的第3文的翻译文。
【技术特征摘要】
2017.05.23 JP 2017-1014671.一种翻译文生成方法,是翻译文生成装置中的翻译文生成方法,所述翻译文生成装置生成在第1语言与第2语言之间的翻译处理中使用的翻译文,所述翻译文生成方法包括:取得所述第1语言的第1文、将该第1文翻译成所述第2语言而得到的第1翻译文、所述第1语言的第2文、和将该第2文翻译成所述第2语言而得到的第2翻译文,生成将所述第1翻译文和所述第2翻译文使用所述第2语言的第2连词构成为一个文句而得到的第3翻译文来作为将所述第1文和所述第2文使用所述第1语言的第1连词构成为一个文句而得到的第3文的翻译文。2.根据权利要求1所述的翻译文生成方法,还包括:至少输出所述第3翻译文。3.根据权利要求1所述的翻译文生成方法,还包括:基于连接规则确定所述第1连词,所述连接规则表现表示文句的属性的属性信息与所述第1连词的对应关系,使用确定出的所述第1连词、所述第1文以及所述第2文,生成所述第3文。4.根据权利要求3所述的翻译文生成方法,所述连接规则还表现所述属性信息与所述第2连词的对应关系,基于所述连接规则确定所述第2连词,使用确定出的所述第2连词、所述第1翻译文以及所述第2翻译文,生成所述第3翻译文。5.根据权利要求3或4所述的翻译文生成方法,所述属性信息是表示根据所述文句的含义分类的类别的信息。6.根据权利要求5所述的翻译文生成方法,通过从类别数据库中检索与所述第1文所包含的单词或者词句相符的所述类别,确定所述第1文的所述类别,所述类别数据库将文句可能包含的单词或者词句与该文句的所述类别进行关联而存储,通过从所述类别数据库中检索与所述第2文所包含的单词或者词句相符的所述类别,确定所述第2文的所述类别。7.根据权利要求5或6所述的翻译文生成方法,所述连接规则存储于连接规则数据库,所述连接规则数据库将作为所述类别之一的第1类别和作为所述类别之一的第2类别的组合、所述第1连词、与所述第2连词进行关联而存储,通过从所述连接规则数据库中检索与所述第1文的所述第1类别和所述第2文的所述第2类别的组合对应的所述第1连词以及所述第2连词,确定所述第1连词以及所述第2连词。8.根据权利要求1至7中任一项所述的翻译文生成方法,从对译语料库存储部取得所述第1文、与所述第1文对应的所述第1翻译文、所述第2文、和与所述第2文对应的所述第2翻译文,所述对译语料库存储部存储使由所述第1语言构成的文与该文向所述第2语言的翻译文相关联的对译语料库。9.根据权利要求8所述的翻译文生成方法,还包括:通过将所述第3文与所述第3翻译文相关联并保存于所述对译语料库存储部,更新所述对译语料库;还包括:利用所述更新后的对译语料库,学习在所述翻译处理中使用的机器翻译模型。10.根据权利要求8所述的翻译文生成方法,还包括:取得第1判定信息,所述第1判定信息表示判定所述第1翻译文是否正确而得到的判定结果;还包括:取得第2判定信息,所述第2判定信息表示判定所述第2翻译文是否正确而得到的判定结果;在基于所述第1判定信息以及所述第2判定信息判定为所述第1翻译文以及所述第2翻译文均正确的情况下,生成所述第3翻译文。11.根据权利要求10所述的翻译文生成方法,还包括:显示所述第1翻译文、用于让用户输入判定所述第1翻译文是否正确而得到的判定结果的第1对象、所述第2翻译文、和用于让所述用户输入判定所述第2翻译文是否正确而得到的判定结果的第2对象。12.根据权利要求9所述的翻译文生成方法,还包括:取得将所述第1翻译文应用于所述机器翻译模型从而翻译成所述第1语言所得到的第1逆向翻译文;还包括:取得将所述第2翻译文应用于所述机器翻译模型从而翻译成所述第1语言所得到的第2逆向翻译文;还包括:取得第3判定信息,所述第3判定信息表示判定所述第1逆向翻译文是否正确而得到的判定结果;还包括:取...
【专利技术属性】
技术研发人员:藤原菜菜美,山内真树,今出昌宏,
申请(专利权)人:松下知识产权经营株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。