用于数据分析和商业智能的模型本地化制造技术

技术编号:35339743 阅读:13 留言:0更新日期:2022-10-26 12:03
一种用于模型本地化的方法(301)包括:解析(320)模型(200)以识别可翻译词项,生成(340)将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换(330)模型(200)中的每个可翻译词项的种子文件(140、290B),并且将可翻译词项中的每个可翻译词项提交(350)到目标语言的机器翻译(150)以产生不同翻译文件(160、290A),该不同翻译文件(160、290A)将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射。该方法还包括使用不同翻译文件来将模型部署(370)在数据分析应用(100、270)中以在数据分析应用的用户界面(232)内将每个可翻译词项动态地翻译成对应翻译词项。每个可翻译词项动态地翻译成对应翻译词项。每个可翻译词项动态地翻译成对应翻译词项。

【技术实现步骤摘要】
【国外来华专利技术】用于数据分析和商业智能的模型本地化


[0001]本公开涉及计算机程序中的内容的本地化的领域。

技术介绍

[0002]在计算机领域中,国际化和本地化是指计算机软件对目标地区的不同语言、区域特点和技术要求的适应。在过去,本地化要求以期望地区的语言对用户界面以及在合适的情况下底层编程变量的人工代码化。最近,计算机程序的表示层已经被抽象以包括占位符,这些占位符然后可以被映射到存储在表中的本地特定词项。以这种方式,仅需要指定计算机程序的表示层的单一抽象形式,同时针对相应不同地区的一系列不同表可以被提供以按需使表示层本地化。
[0003]尽管用于表示层的本地化的前述技术能够是相当高效的,但是使数据库本地化实质上更加复杂。用于使数据库本地化的一种技术是将以不同语言或不同地区习俗的存储数据的不同版本存储在每个记录的不同列中。在另一技术中,数据库的一个表仅包括地区无关数据,而地区特定数据被分离到不同表或一个表的不同行中。但是,在所有情况下,如此明显,就数据库大小而言具有成本。用于以数据库实现的数据模型的本地化还能够以与使数据库本身本地化的方式类似的方式来实现,伴随着类似的结果。
[0004]值得注意的是,在本地化的所有实例中,都难以逃脱为每个通用占位符选择相关翻译词项的要求。因此,翻译者的人工干预仍然是至关重要的。而且,在这么多实例中,词项可以具有取决于词项已经被使用在其中的上下文的不同翻译。而且,一旦模型已经使用一系列翻译词项以本地化方式被指定,就不存在随时间在其认识到在数据库模型中针对特定词项存在更好的翻译时校正不同翻译的简单方式。因此,模型本地化仍然不完美。

技术实现思路

[0005]本公开的一个方面提供一种用于数据分析中的模型本地化的计算机实现的方法。用于模型本地化的计算机实现的方法当在数据处理硬件上执行时使数据处理硬件执行包括以下的操作:解析模型以识别可翻译词项;生成将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换模型中的每个可翻译词项的种子文件;以及将可翻译词项中的每个可翻译词项提交到目标语言的机器翻译以产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件。操作还包括使用不同翻译文件来将模型部署在数据分析应用中以在对数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
[0006]本公开的各方面可以包括以下可选特征中的一个或多个。在一些实施方式中,操作还包括:将数据分析应用的终端用户指定为授权翻译者;以视觉上有区别的方式在用户界面中呈现每个对应翻译词项;以及从授权翻译者接收对应翻译词项的接受或拒绝。在这些实施方式中,针对由授权翻译者拒绝的每个对应翻译词项,操作还包括从授权翻译者接收替代翻译并且将替代翻译存储在不同翻译文件中。
[0007]在一些示例中,操作还包括:检测模型的变化;重新生成种子文件以考虑可翻译词项的变化;将可翻译词项中的每个变化的可翻译词项重新提交到目标语言的机器翻译以产生更新的翻译文件;以及使用更新的不同翻译文件将模型重新部署在数据分析应用中。种子文件可以包括预先存在的种子文件的副本。
[0008]在本公开的另一方面中,一种数据分析数据处理系统被配置用于模型本地化。该系统包括:主机计算平台,其包括具有存储器和至少一个处理器的至少一个计算机;以及其中存储了数据库模型的固定储存器。该系统还包括:数据分析应用,其在主机计算平台中执行;以及机器翻译器,其在主机计算平台中执行。最后,该系统包括:模型本地化模块,其包括在主机计算平台中执行期间启用以执行包括以下的操作的计算机程序指令:解析模型以识别可翻译词项;以及生成将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换模型中的每个可翻译词项的种子文件。操作还包括:将可翻译词项中的每个可翻译词项提交到目标语言的机器翻译器以产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件。操作还包括使用不同翻译文件来将模型部署在数据分析应用中以在数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
[0009]本公开的这个方面可以包括以下可选特征中的一个或多个。在一些示例中,操作进一步包括:将数据分析应用的终端用户指定为授权翻译者;以视觉上有区别的方式在用户界面中呈现每个对应翻译词项;从授权翻译者接收对于对应翻译词项的接受或拒绝;以及针对由授权翻译者拒绝的每个对应翻译词项,从授权翻译者接收替代翻译并且将替代翻译存储在不同翻译文件中。
[0010]在一些实施方式中,操作进一步包括:检测模型的变化;重新生成种子文件以考虑可翻译词项的变化;将可翻译词项中的每个变化的可翻译词项重新提交到目标语言的机器翻译以产生更新的翻译文件;以及使用更新的不同的翻译文件将模型重新部署在数据分析应用中。在一个示例中,种子文件是预先存在的种子文件的副本。
[0011]本公开的另一方面提供一种用于模型本地化的计算机程序产品。该计算机程序产品包括具有随其体现的程序指令的计算机可读存储介质,程序指令能由设备执行以使设备执行操作。操作包括:解析模型以识别可翻译词项;生成将可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换模型中的每个可翻译词项的种子文件;将可翻译词项中的每个可翻译词项提交到目标语言的机器翻译以产生将来自种子文件的每个标签与可翻译词项中的对应一个可翻译词项的以目标语言的翻译词项映射的不同翻译文件;以及使用不同翻译文件来将模型部署在数据分析应用中以在数据分析应用的用户界面内将每个可翻译词项动态地翻译成对应翻译词项。
[0012]本公开的这个方面可以包括以下可选特征中的一个或多个。在一些示例中,操作进一步包括:将数据分析应用的终端用户指定为授权翻译者;以视觉上有区别的方式在用户界面中呈现每个对应翻译词项;从授权翻译者接收对于对应翻译词项的接受或拒绝;以及针对由授权翻译者拒绝的每个对应翻译词项,从授权翻译者接收替代翻译并且将替代翻译存储在不同翻译文件中。
[0013]在一些实施方式中,操作进一步包括:检测模型的变化;重新生成种子文件以考虑可翻译词项的变化;将可翻译词项中的每个变化的可翻译词项重新提交到目标语言的机器
翻译以产生更新的翻译文件;以及使用更新的不同翻译文件将模型重新部署在数据分析应用中。可选地,种子文件是预先存在的种子文件的副本。
[0014]在附图和下面的描述中阐述本公开的一个或多个实施方式的细节。其他方面、特征和优点将从说明书和附图以及从权利要求书显而易见。
附图说明
[0015]图1是用于模型本地化的图画图示;
[0016]图2是适于模型本地化的数据处理系统的示意性图示;以及
[0017]图3是图示用于模型本地化的过程的流程图。
[0018]各个附图中的相同附图标记指示相同的元件。
具体实施方式
[0019]本公开的示例提供用于模型本地化。根据本公开的示例,针对数据库生成数据模型并且将数据模型加载本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于模型本地化的计算机实现的方法(301),所述方法在由数据处理硬件执行时使所述数据处理硬件执行操作,所述操作包括:解析(320)模型(200)以识别可翻译词项;生成(340)种子文件(140、290B),所述种子文件(140、290B)将所述可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换(330)所述模型(200)中的每个可翻译词项;将所述可翻译词项中的每个可翻译词项提交(350)到目标语言的机器翻译(150)以产生不同翻译文件(160、290A),所述不同翻译文件(160、290A)将来自所述种子文件(140、290B)的每个标签与所述可翻译词项中的对应一个可翻译词项的处于所述目标语言的翻译词项进行映射;以及使用所述不同翻译文件(160、290A)来将所述模型(200)部署(370)在数据分析应用(100、270)中,以在所述数据分析应用(100、270)的用户界面(232)内将每个可翻译词项动态地翻译成对应翻译词项。2.根据权利要求1所述的方法(301),其中,所述操作进一步包括:将所述数据分析应用(100、270)的终端用户指定为授权翻译者;以视觉上有区别的方式在所述用户界面(232)中呈现(380)每个对应翻译词项;从所述授权翻译者接收(390)对所述对应翻译词项的接受或拒绝;以及针对由所述授权翻译者拒绝的每个对应翻译词项,从所述授权翻译者接收(400)替代翻译并且将所述替代翻译存储在所述不同翻译文件(160、290A)中。3.根据权利要求1或权利要求2所述的方法(301),其中,所述操作进一步包括:检测(380)所述模型(200)中的变化;重新生成(340)所述种子文件(140、290B)以考虑所述可翻译词项中的变化;将所述可翻译词项中的每个变化的可翻译词项重新提交(350)到所述目标语言的机器翻译,以产生更新的翻译文件(160、290A);以及使用不同的所述更新的翻译文件(160、290A)将所述模型(200)重新部署(370)在所述数据分析应用(100、270)中。4.根据权利要求1

3中的任一项所述的方法(301),其中,所述种子文件(140、290B)是预先存在的种子文件(140、290B)的副本。5.一种被配置用于模型本地化的数据分析数据处理系统(201),包括:主机计算平台(210),包括具有存储器(260)和至少一个处理器(212)的至少一个计算机;存储有数据库模型(120、200)的固定储存器;在所述主机计算平台(210)中执行的数据分析应用(100、270);在所述主机计算平台(210)中执行的机器翻译器(150、280);包括计算机程序指令的模型本地化模块(300),所述计算机程序指令在所述主机计算平台(210)中执行期间启用以执行操作,所述操作包括:解析所述模型(200)以识别可翻译词项;生成种子文件(140、290B),所述种子文件(140、290B)将所述可翻译词项中的每个可翻译词项与对应标签相关联并且用对应标签替换所述模型(200)中的每个可翻译词项;
将所述可翻译词项中的每个可翻译词项提交到目标语言的所述机器翻译器(150、280)以产生不同翻译文件(160、290A),所述不同翻译文件(160、290A)将来自所述种子文件(140、290B)的每个标签与所述可翻译词项中的对应一个可翻译词项的处于所述目标语言的翻译词项进行映射;以及使用所述不同翻译文件(160、290A)来将所述模型(200)部署在所述数据分析应用(100、270)中,以在所述...

【专利技术属性】
技术研发人员:安德鲁
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1