System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 由参考文件指导的机器翻译制造技术_技高网

由参考文件指导的机器翻译制造技术

技术编号:40844860 阅读:7 留言:0更新日期:2024-04-01 15:12
用于将源语言的文件计算机化机器翻译为目标语言的系统和方法,其中所述翻译由附加输入指导,所述附加输入是源语言的一个或多个参考文件及其相应的目标语言的参考翻译,或者是其链接。

【技术实现步骤摘要】
【国外来华专利技术】

本文讨论的实施例总体上涉及计算机辅助翻译和机器翻译。


技术介绍

1、计算机辅助翻译或机器翻译已经从借助词典将单词从一种语言简单映射到另一种语言发展至更复杂的映射过程,该过程利用保存在数据库中的短语甚至整个句子的过往翻译进行检索和重复使用。这种方法使翻译人员能够重复使用以前的翻译,从而节省完成整个翻译的时间。然而,翻译的准确性取决于数据库中保存的短语或句子,尽管随着数据库变大,准确性可随着时间的推移而提高。

2、即使将单词从一种语言映射到另一种语言,一个单词通常也会有超过一种翻译,并且使用该单词的上下文对于该单词的最佳翻译的选择至关重要。因此,数据库应包含短语和句子适合于不同上下文的多种翻译。例如,上下文可能提示翻译应具有正式的语气或风格,而不是非正式的会话语气或风格。尽管翻译人员可以手动验证或确认短语或句子在给定上下文中的最佳翻译的选择,但在该选择过程中可以采用自动化方法,由此,翻译系统向翻译者提供考虑上下文的翻译,而无需手动验证该选择。

3、问题是:如何向翻译系统传达您想要的翻译的上下文和风格?虽然源文件可以提供关于上下文的信息,并在此过程中提供关于所需翻译风格的信息,但用户通常能够根据类似的参考文件以及用户特别喜欢的其参考翻译来提供他们想要的示例。由于各种原因,参考文件和参考翻译中的短语和句子不一定已经存储在过往翻译的数据库中。例如,机器翻译系统的数据库可能侧重于消费电子产品新闻发布,但在诸如法律等其他领域可能缺乏经验或深度。在其他情况下,出于保密原因,数据库可能未存储参考文件和翻译的信息。

<p>4、因此,实施例试图创建一种技术解决方案来解决上述挑战。


技术实现思路

1、本专利技术的实施例包括用于在附加输入的指导下将源文件从源语言机器翻译为目标语言的目标文件的系统和方法,所述附加输入可以动态地提供并且无法从存储的数据库中获得。在一个实施例中,所述附加输入可能是保密的并且可能无法共享,或者由于严格的保密性要求,所述附加输入的部分可能未存储。在一个实施例中,所述附加输入可包括源语言的一个或多个参考文件及其相应的目标语言的参考翻译。在另一个实施例中,所述参考文件和参考翻译可以通过链接动态地提供。

2、在另一个实施例中,所述附加输入可包括关于源文件在句子水平或短语水平上的翻译的期望。在进一步的实施例中,相比于相同句子或短语的先前存在的翻译(如果有的话),可以选择或优先选择在参考翻译中使用的句子或短语。

本文档来自技高网
...

【技术保护点】

1.一种用于将源语言的源文件机器翻译为目标语言的目标文件的计算机实现的方法,其包括:

2.根据权利要求1所述的计算机实现的方法,其中所述参考文件包括以下至少之一:所述源文件的部分样本文件,所述源文件的完整样本文件,或指向所述参考文件的链接。

3.根据权利要求1所述的计算机实现的方法,其中所述参考翻译包括以下至少之一:所述参考文件的部分翻译,所述参考文件的完整翻译,或指向所述参考翻译的链接。

4.根据权利要求1所述的计算机实现的方法,其中所述翻译实体包括以下至少之一:由句号界定的一系列单词,或由换行符界定的一系列单词。

5.根据权利要求1所述的计算机实现的方法,其中构建所述内容模型包括构建所述参考文件和所述参考翻译中的至少一个术语的翻译词汇表。

6.根据权利要求1所述的计算机实现的方法,其中构建所述内容模型包括构建专用术语,其中构建所述专用术语进一步包括对所述参考文件和所述参考翻译中的单词和短语的频率与所述单词和短语的一般频率相比进行统计分析。

7.一种计算机可读介质,其上存储有计算机可执行指令,用于由处理器执行以将源语言的源文件机器翻译为目标语言的目标文件,其中所述计算机可执行指令包括:

8.根据权利要求7所述的计算机实现的方法,其中所述参考文件包括以下至少之一:所述源文件的部分样本文件,所述源文件的完整样本文件,或指向所述参考文件的链接。

9.根据权利要求7所述的计算机实现的方法,其中所述参考翻译包括以下至少之一:所述参考文件的部分翻译,所述参考文件的完整翻译,或指向所述参考翻译的链接。

10.根据权利要求7所述的计算机实现的方法,其中所述翻译实体包括以下至少之一:由句号界定的一系列单词,或由换行符界定的一系列单词。

11.根据权利要求7所述的计算机实现的方法,其中构建所述内容模型包括构建所述参考文件和所述参考翻译中的至少一个术语的翻译词汇表。

12.根据权利要求7所述的计算机实现的方法,其中构建所述内容模型包括构建专用术语,其中构建所述专用术语进一步包括对所述参考文件和所述参考翻译中的单词和短语的频率与所述单词和短语的一般频率相比进行统计分析。

13.一种用于将源语言的源文件机器翻译为目标语言的目标文件的计算机编程的系统,其包括:

14.根据权利要求13所述的计算机编程的系统,其中所述参考文件包括以下至少之一:所述源文件的部分样本文件,所述源文件的完整样本文件,或指向所述参考文件的链接。

15.根据权利要求13所述的计算机编程的系统,其中参考翻译包括以下至少之一:所述参考文件的部分翻译,所述参考文件的完整翻译,或指向参考翻译的链接。

16.根据权利要求13所述的计算机编程的系统,其中所述翻译实体包括以下至少之一:由句号界定的一系列单词,或由换行符界定的一系列单词。

17.根据权利要求13所述的计算机编程的系统,其中所述处理器被配置为构建所述参考文件和参考翻译中的至少一个术语的翻译词汇表。

18.根据权利要求13所述的计算机编程的系统,其中所述处理器被配置为构建专用术语,其中构建所述专用术语进一步包括对所述参考文件和参考翻译中的单词和短语的频率与所述单词和短语的一般频率相比进行统计分析。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于将源语言的源文件机器翻译为目标语言的目标文件的计算机实现的方法,其包括:

2.根据权利要求1所述的计算机实现的方法,其中所述参考文件包括以下至少之一:所述源文件的部分样本文件,所述源文件的完整样本文件,或指向所述参考文件的链接。

3.根据权利要求1所述的计算机实现的方法,其中所述参考翻译包括以下至少之一:所述参考文件的部分翻译,所述参考文件的完整翻译,或指向所述参考翻译的链接。

4.根据权利要求1所述的计算机实现的方法,其中所述翻译实体包括以下至少之一:由句号界定的一系列单词,或由换行符界定的一系列单词。

5.根据权利要求1所述的计算机实现的方法,其中构建所述内容模型包括构建所述参考文件和所述参考翻译中的至少一个术语的翻译词汇表。

6.根据权利要求1所述的计算机实现的方法,其中构建所述内容模型包括构建专用术语,其中构建所述专用术语进一步包括对所述参考文件和所述参考翻译中的单词和短语的频率与所述单词和短语的一般频率相比进行统计分析。

7.一种计算机可读介质,其上存储有计算机可执行指令,用于由处理器执行以将源语言的源文件机器翻译为目标语言的目标文件,其中所述计算机可执行指令包括:

8.根据权利要求7所述的计算机实现的方法,其中所述参考文件包括以下至少之一:所述源文件的部分样本文件,所述源文件的完整样本文件,或指向所述参考文件的链接。

9.根据权利要求7所述的计算机实现的方法,其中所述参考翻译包括以下至少之一:所述参考文件的部分翻译,所述参考文件的完整翻译,或指向所述参考翻译的链接。

...

【专利技术属性】
技术研发人员:陈敏儿钱玉麟林东扬罗霖凯吴震邦张武
申请(专利权)人:译谷有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1