多语言处理方法及装置制造方法及图纸

技术编号:22166166 阅读:28 留言:0更新日期:2019-09-21 10:16
本发明专利技术提供了一种多语言处理方法及装置,多语言处理方法包括:根据源代码中的字符分隔符识别出所述源代码中的当前自然语言;根据所述当前自然语言生成语言文字标识,所述语言文字标识为预设的翻译数据库中与所述当前自然语言及目标自然语言所对应的字符;在所述翻译数据库中查找所述语言文字标识所对应的目标自然语言。本发明专利技术可以节省大量的开发编码工作,提高了软件系统的可靠性。

Multilingual Processing Method and Device

【技术实现步骤摘要】
多语言处理方法及装置
本专利技术涉及软件编程处理领域,特别是涉及一种多语言处理方法及装置。
技术介绍
软件系统在全球各地使用的情况越来越多,为了满足不同地区、不同语言的使用者,界面和提示需要展现不同国家、地区的语言文字。为解决上述技术问题,在软件系统开发中,目前的做法是:在源代码中使用多语言转换函数,嵌入语言文字标识、键值名称,并且生成语言文字标识、键值名称和具体语言文字及键值数据的关联文件。软件系统运行时,通过动态关联具体语言文字/键值数据进行展示。软件系统的整个生命周期中,该方法存在以下问题:(1)源代码中嵌入语言文字标识后,开发人员无法直接理解语言文字标识代表的含义,源代码的可读性下降,导致后续软件维护和升级成本提高。类似语言文字标识:PUB_COMPANY_000、PRI_T5270_MO_001等。(2)源代码涉及语言文字处理,包含界面脚本、打印脚本、业务逻辑程序。其中界面脚本和打印脚本转换为语言文字标识后,由于嵌入的字串长度变化,将打乱原有在可视化开发视图的版面格式,对于后期维护最为不利。比如“公司”占4个字符,转换为多语言标识PUB_COMPANY_000后占据15个字符,在某些可视化开发视图中,展示长度将因此延长,影响整体可视化效果。(3)源代码中嵌入语言文字标识、语言文字标识和具体语言文字的关联关系,这两项工作属于非业务逻辑的功能,但需要嵌入业务逻辑代码中,增加了业务逻辑开发的工作量和困难,影响项目的开发进度。(4)翻译业务需求中的母语,需要开发人员拆解词条或语句,提供给翻译人员翻译,译文再由开发人员加工成关联文件,占用业务逻辑实现的时间,影响项目的开发进度。综上,目前的缺乏一种既可以满足多区域复用,又可以减少开发工作量及提高代码可维护性的软件系统源代码中的多语言处理方法。
技术实现思路
针对现有技术中的问题,本专利技术提供了一种可以节省全球性软件系统开发和维护过程中处理工作的人力成本的多语言处理方法及装置,该方法节省了大量的开发编码工作,同时也提高了软件系统的可靠性。为解决上述技术问题,本专利技术提供以下技术方案:第一方面,本专利技术提供一种多语言处理方法,包括:根据源代码中的字符分隔符识别出源代码中的当前自然语言;根据当前自然语言生成语言文字标识,语言文字标识为预设的翻译数据库中与当前自然语言及目标自然语言所对应的字符;在翻译数据库中查找语言文字标识所对应的目标自然语言。优选地,多语言处理方法还包括:用目标自然语言替换源代码中的当前自然语言。优选地,字符分隔符包括注释符及赋值符。优选地,多语言处理方法还包括:对源代码的字符串进行扫描,获取字符串中的字符分隔符。优选地,根据源代码中的字符分隔符识别出源代码中的当前自然语言,包括:对源代码进行静态语义检查,生成静态语义的检查结果;根据检查结果,生成抽象语法树;根据抽象语法树,识别出源代码中的当前自然语言。优选地,多语言处理方法还包括:将当前自然语言翻译为目标自然语言,并存入翻译数据库。优选地,多语言处理方法还包括:根据运算符、语言文字标示及将当前自然语言替换为目标自然语言后的源代码,生成中间代码;对中间代码进行编译,生成具有目标语言的源代码。第二方面,本专利技术提供一种多语言处理装置,该装置包括:自然语言识别单元,用于根据源代码中的字符分隔符识别出源代码中的当前自然语言;语言文字标识生成单元,用于根据当前自然语言生成语言文字标识,语言文字标识为预设的翻译数据库中与当前自然语言及目标自然语言所对应的字符;自然语言查找单元,用于在翻译数据库中查找语言文字标识所对应的目标自然语言。优选地,多语言处理装置还包括:替换单元,用于目标自然语言替换源代码中的当前自然语言。优选地,多语言处理装置还包括:源代码扫描单元,用于对源代码的字符串进行扫描,获取字符串中的字符分隔符。优选地,自然语言识别单元包括:静态语义检查模块,用于对源代码进行静态语义检查,生成静态语义的检查结果;抽象语法树生成模块,用于根据检查结果,生成抽象语法树;当前自然语言识别模块,用于根据抽象语法树,识别出源代码中的当前自然语言。优选地,多语言处理装置,还包括:中间代码生成单元,用于根据运算符、语言文字标示及将当前自然语言替换为目标自然语言后的源代码,生成中间代码;目标语言源代码生成单元,用于对中间代码进行编译,生成具有目标语言的源代码。第三方面,本专利技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现多语言处理方法的步骤。第四方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现多语言处理方法的步骤。从上述描述可知,本专利技术提供的多语言处理方法及装置,通过识别源代码中的字符分隔符及其上下文,可以识别出源代码中的当前自然语言,并在预设的翻译数据库中查找与当前自然语言所对应的目标自然语言,进而生成具有目标自然语言的源代码。当翻译数据库中不存在当前自然语言时,本专利技术还提供如何将该当前自然语言如何翻译为目标自然语言,并存储于翻译数据中的方法,具体的:将当前自然语言翻译为目标语言之后,在翻译数据库中新增对应的语言文字标识及将当前自然语言翻译之后的目标自然语言,同时存入到翻译数据库中。本专利技术提供的多语言处理方法将源代码中的多语言的处理工作剥离编码环节,并将其放到编译环节自动完成,节省了大量的开发编码工作,同时由于本专利技术采用非人工处理源代码,进而提高了软件系统的可靠性,解决了跨国、跨地区软件系统在开发和维护过程中,为动态展现不同语言文字而导致源代码可读性下降的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的实施例中方法10的流程示意图;图2为本专利技术的实施例中步骤100的流程示意图;图3为本专利技术的实施例中方法20的流程示意图;图4为本专利技术的具体应用实例中多语言处理方法30的流程示意图;图5为本专利技术的具体应用实例中多语言处理方法的流程示意图;图6为本专利技术的具体应用实例中多语言文件生成流程示意图;图7为本专利技术的具体应用实例中多语言处理装置的结构示意图一;图8为本专利技术的具体应用实例中多语言处理装置的结构示意图二;图9为本专利技术的具体应用实例中多语言处理装置的结构示意图三;图10为本专利技术的实施例中的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例中所使用的当前自然语言及目标自然语言均指为自然语言,如俄文、日文等;程序语言为计算机语言,如Java等。鉴于现有技术中缺乏一种既可以满足多区域复用,又可以减少开发工作量及提高代码可维护性的软件系统源代码中的多语言处理方法。本专利技术的实施例提供一种多语言处理方法的具体本文档来自技高网
...

【技术保护点】
1.一种多语言处理方法,其特征在于,包括:根据源代码中的字符分隔符识别出所述源代码中的当前自然语言;根据所述当前自然语言生成语言文字标识,所述语言文字标识为预设的翻译数据库中与所述当前自然语言及目标自然语言所对应的字符;在所述翻译数据库中查找所述语言文字标识所对应的目标自然语言。

【技术特征摘要】
1.一种多语言处理方法,其特征在于,包括:根据源代码中的字符分隔符识别出所述源代码中的当前自然语言;根据所述当前自然语言生成语言文字标识,所述语言文字标识为预设的翻译数据库中与所述当前自然语言及目标自然语言所对应的字符;在所述翻译数据库中查找所述语言文字标识所对应的目标自然语言。2.根据权利要求1所述的多语言处理方法,其特征在于,还包括:用所述目标自然语言替换所述源代码中的所述当前自然语言。3.根据权利要求1所述的多语言处理方法,其特征在于,所述字符分隔符包括注释符及赋值符。4.根据权利要求1所述的多语言处理方法,其特征在于,还包括:对源代码的字符串进行扫描,获取所述字符串中的字符分隔符。5.根据权利要求1所述的多语言处理方法,其特征在于,所述根据所述源代码中的字符分隔符识别出所述源代码中的当前自然语言,包括:对所述源代码进行静态语义检查,生成静态语义的检查结果;根据所述检查结果,生成抽象语法树;根据抽象语法树,识别出所述源代码中的当前自然语言。6.根据权利要求1所述的多语言处理方法,其特征在于,还包括:将所述当前自然语言翻译为所述目标自然语言,并存入所述翻译数据库。7.根据权利要求2所述的多语言处理方法,其特征在于,还包括:根据运算符、所述语言文字标示及将当前自然语言替换为目标自然语言后的源代码,生成中间代码;对中间代码进行编译,生成具有所述目标语言的源代码。8.一种多语言处理装置,其特征在于,包括:自然语言识别单元,用于根据源代码中的字符分隔符识别出所述源代码中的当前自然语言;语言文字标识生...

【专利技术属性】
技术研发人员:徐忠民邹大卫周新衡钟智敏
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1