当前位置: 首页 > 专利查询>慕迪灵公司专利>正文

翻译质量量化设备和方法技术

技术编号:2826305 阅读:239 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种使译文质量评估自动化的系统(10)。该系统(10)可包括具有可操作地互连的处理器(14)和存储装置(16)的计算机(12)。第一语言的源文本可存储在存储装置(16)中。包括源文本转变为第二语言的译文的目标文本也可存储在存储装置(16)中。另外,多个可执行程序可存储在存储装置(16)上且被成形为当由处理器(14)执行时能够独立地识别包括一个或多个样本段的测试样本,每个样本段包括匹配的组,该组具有选自所述源文本的源部分和选自所述目标文本的对应的目标部分。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
1.
本专利技术涉及语言翻译系统,更具体地讲涉及用于增强译文翻译和译审的客观性的新型系统和方法。2.
技术介绍
随着自身的发展壮大和在全球市场中的扩张,公司有必要对其提供的产品、服务和支持文档进行全球化。这类产品、服务等均须专门定制以满足目标市场的具体文化、语言、法律和技术要求。要想高效,就必须以及时、经济、准确且可重复的方式提供这种定制。在将一种产品推向新市场的准备过程中,相当一部分的时间和费用都花费在翻译用户手册、宣传资料等方面。所用时间和费用的多少取决于当前生成优质译文所需的大量人力。例如目前,即便“完成”了翻译,也只有在训练有素的译审人员阅读和分析已翻译文档的显著部分后,才能确定译文质量的具体水平。而译审人员难以确定在某一特定文档中他或她必须阅读哪些部分以及阅读这些部分的多少内容才能准确评估译文质量。因此,译审人员通常会审阅和分析更多而非更少的材料。通常,译审人员将审阅和分析整个文档。此外,即使一名译审人员凭借经验得出合理的样本大小和抽样频率,该译审人员可能仍然无法得到可重复的结果。再者,某一译审人员采用的样本大小和抽样频率可能与另一名译审人员所用的大相径庭。因此,译审流程中可能存在明显的不一致性。上述及其它的不一致性和当前使用的费时方法增加了成本并降低了所产生的译文的质量。因此需要一种可为所有类型的文档和材料的译文提供客观的、自动化的质量控制或质量保证的设备和方法。另外还需要一种将这种客观的质量控制集成到监控翻译流程所有部分或其大部分的翻译系统中的设备和方法。-->
技术实现思路
鉴于上述情况,根据本文对本专利技术的具体及简要描述,本专利技术的一个实施例中所公开的方法和设备包括由不同组件组成的翻译系统,这些组件包括翻译辅助软件、质量量化软件和资源管理软件。翻译团队可使用翻译辅助软件所提供的工具和功能以有效且可预测的方式将源文档翻译成目标文档。译审团队可使用质量量化软件所提供的工具和功能来有效且客观地确定翻译团队所生成的译文质量。资源管理软件可在质量量化软件收集到的数据的范围内协助管理人员识别模式并提供框架,通过此框架传达和执行对整个系统或对其运行的更改和调整。在选定的实施例中,选定的信息、程序、电子文档等的库或数据库可被各种软件程序使用并包括在根据本专利技术的翻译系统中。例如,翻译辅助软件可从数据库中检索源(未翻译的)文档和将目标(已翻译的)文档保存到数据库中。同样,质量量化软件从数据库中检索源文档和目标文档和将质量数据保存到数据库中。另外,资源管理软件可从数据库中检索文档和质量数据,并通过数据库传达指令、项目、更改和调整。根据本专利技术,翻译系统的运行首先是从由译者组成的翻译团队中选择译者。译者可使用翻译辅助软件来检索和翻译未翻译的源文档,以及存储所得的已翻译的目标文档。然后,从译审团队中选择译审人员。译审人员可使用质量量化软件来检索目标文档和对应的源文档,以及对所示译文进行客观评估。在选定的实施例中,该评估可包括应用预定的评价标准。如果译文通过具有阈值分数的评估,则目标文档即可定稿。作为另外一种选择,如果译文未达到至少阈值分数,则可能要接受完整编辑、其它评估等。通过对先前已确定的评估进行存储,可继续运行该系统。一旦存储,即可结合先前采集的数据并分析评估以识别模式,例如文档类型、内容类型、译者等方面的模式。模式一经识别,就可改进资源分配。适当的改进可包括对特定译者的单独反馈、对整个翻译团队的总体反馈、调整分配给特定译者的译文数量、大小或类型、调整给定的特定译者的报酬等。-->根据本专利技术,可以采用任何适当的方式将运行翻译系统的各个步骤或任务在翻译辅助软件、质量量化软件和资源管理软件中划分。例如,在选定的实施例中,翻译辅助软件可协助译者检索和翻译未翻译文档,以及将所得的已翻译目标文档存储到数据库中。质量量化软件可协助译审人员检索目标文档和对应的源文档、客观地评估所示译文、以及将评估结果存储到数据库中。资源管理软件可协助管理选择译者、选择译审人员、识别模式和改进资源分配。附图说明通过结合附图阅读以下说明和所附权利要求,本专利技术的上述特征将变得显而易见。应当理解,这些附图只图示了本专利技术的典型实施例,因此不可认为是对其范围的限制。将使用下列附图来描述本专利技术的其它特异性和细节:图1为示意性框图,其图示说明用于执行根据本专利技术的翻译系统的计算机系统;图2为示意性框图,其提供了对根据本专利技术的翻译系统的高度概览;图3为图示说明运行图2所示翻译系统的可行方法的框图;图4为能够实施根据本专利技术的翻译系统的网络的一个实施例的示意图;图5为图示说明根据本专利技术的翻译辅助软件的一个实施例的示意性框图,该翻译辅助软件包括各种可能模块和用于存储该翻译辅助软件所用信息和记录的相应的数据库;图6为图示说明根据本专利技术的质量量化软件的一个实施例的示意性框图,该质量量化软件包括各种可能模块(例如,通常“可执行程序”)和用于存储该质量量化软件所用信息和记录的相应的数据库;图7为图示说明用于结合到根据本专利技术的质量量化软件内的评价标准模块的一个实施例的示意性框图;图8为图示说明客观性和人工干预之间的逆相关性的坐标图;图9为图示说明人工干预和自动化控制之间的逆相关性的坐标图;-->图10为图示说明根据本专利技术的翻译评估中可能包含的各种自动化要素和人为要素的框图;图11为图示说明根据本专利技术的翻译评估中可能施加在人为要素上的各种控制的框图;图12为图示说明用于结合到根据本专利技术的质量量化软件内的错误报告模块的一个实施例的示意性框图;图13为图示说明用于结合到质量量化软件内的输出模块的一个实施例的示意性框图;图14为图示说明用于计算根据本专利技术的译文总体质量指数的一种方法的示意性框图;以及图15为图示说明根据本专利技术,包括各种可能模块的资源管理软件的一个实施例的示意性框图。具体实施方式易于理解的是,本专利技术的组件,如本文一般性描述和在附图中所示,可按许多不同的构造进行布置和设计。因此,本专利技术的系统和方法的实施例的以下详述(如附图所示)并非旨在限制本专利技术所要求保护的范围,而只是本专利技术的各种实施例的代表。参见附图可更好地理解本专利技术的图示实施例,其中类似部件由类似的数字标示。参见图1,用于执行本专利技术的设备10或系统10可包括一个或多个节点12(例如客户端12、计算机12)。这些节点12可包括处理器14或CPU 14。CPU 14可以可操作地连接到存储装置16。存储装置16可包括一种或多种装置,诸如硬盘18或其它永久性存储装置18、只读存储器20(ROM 20)和随机存取(且通常为易失性的)存储器22(RAM 22或可操作存储器22)。这些组件14、16、18、20、22可共同存在于单个节点12中,或者分别存在于多个远程节点12中。在选定的实施例中,设备10可包括用于接收来自用户或另一个装置的输入装置24。输入装置24可包括一种或多种物理实施例。例如,可使用键盘26与用户进行交互,也可使用鼠标28或手写板30。可使用触摸屏32、电话34或只是使用远程通信线路34与其它设备、用户等-->进行通信。同样,可使用扫描仪36来接收图形输入,这些图形输入可能会或不会被转换为其它格式。硬盘38或其它存储装置38可用作输入装置,可驻留在网络40连接的具体节点12中或其它节点12中。在选本文档来自技高网...

【技术保护点】
一种系统,所述系统包括:    包括可操作地互连的处理器和存储装置的计算机;    存储在所述存储装置中并且与第一语言对应的源文本;    存储在所述存储装置中并且包括第二语言(区别于第一语言)的源文本的译文的目标文本;和    多个可执行程序,所述多个可执行程序存储在所述存储装置中并被成形为当由所述处理器执行时能够独立地识别包括一个或多个样本段的测试样本,每个样本段包括匹配的组,该组具有选自所述源文本的源部分和选自所述目标文本的对应的目标部分。

【技术特征摘要】
【国外来华专利技术】US 2005-8-25 11/212,9621.一种系统,所述系统包括:包括可操作地互连的处理器和存储装置的计算机;存储在所述存储装置中并且与第一语言对应的源文本;存储在所述存储装置中并且包括第二语言(区别于第一语言)的源文本的译文的目标文本;和多个可执行程序,所述多个可执行程序存储在所述存储装置中并被成形为当由所述处理器执行时能够独立地识别包括一个或多个样本段的测试样本,每个样本段包括匹配的组,该组具有选自所述源文本的源部分和选自所述目标文本的对应的目标部分。2.根据权利要求1所述的系统,其中所述一个或多个样本段中的至少一个样本段的源部分和目标部分之一内所含的字数由所述多个可执行程序确定。3.根据权利要求2所述的系统,其中所述一个或多个样本段中的至少一个样本段的源文本中的源部分和目标部分之一的位置由所述多个可执行程序确定。4.根据权利要求3所述的系统,其中所述位置由所述多个可执行程序内包含的明确公式规定。5.根据权利要求3所述的系统,其中所述位置由所述多个可执行程序随机规定。6.根据权利要求3所述的系统,其中:所述存储装置还存储多个字典条目,这些条目将所述第一语言中的单词与所述第二语言中的单词相匹配;和所述位置由所述多个可执行程序根据既包含在所述源文本和目标文本之一内又包含在所述多个字典条目中的单词的集中程度的变化来选择。7.根据权利要求3所述的系统,其中所述存储装置包括一个或多个电子存储单元。8.根据权利要求7所述的系统,其中所述一个或多个电子存储单元中的至少一个远离所述处理器设置。9.根据权利要求8所述的系统,其中所述一个或多个电子存储单元中的至少一个通过因特网与所述处理器连接。10.根据权利要求1所述的系统,其中所述存储装置包括一个或多个电子存储单元。11.一种系统,所述系统包括:包括可操作地互连的第一处理器和第一存储装置的第一计算机;包括可操作地互连的第二处理器和第二存储装置的第二计算机;第一多个可执行程序...

【专利技术属性】
技术研发人员:MV桑多恩BR桑多尔
申请(专利权)人:慕迪灵公司
类型:发明
国别省市:US[美国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1