一种文本翻译方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:25950303 阅读:24 留言:0更新日期:2020-10-17 03:42
本申请提出了一种文本翻译方法、装置、计算机设备及存储介质,包括:在获取到原始文件后,根据原始文件的标签信息,确定原始文件中的待翻译文件;对待翻译文件进行解析,确定待翻译文件中的第一文本和其他文件信息,并记录第一文本与其他文件信息之间的相对位置信息;对第一文本进行翻译,得到翻译后的第二文本,并将相对位置信息确定为第二文本与其他文件信息之间的相对位置信息;根据第二文本、其他文件信息以及相对位置信息,生成待翻译文件对应的译文文件。在本申请中,可以通过对外文文件中的文本部分进行处理,并回填至原始文件的方法,增加文本翻译的准确率,提高文本翻译的效率。

【技术实现步骤摘要】
一种文本翻译方法、装置、计算机设备及存储介质
本申请涉及文字处理
,尤其涉及一种文本翻译方法、装置、计算机设备及存储介质。
技术介绍
随着全球化的发展以及世界文化的交融,越来越多的外文文件通过互联网进行分享,但是,由于语言的关系,针对用户外文文件的阅读效率低,因此,通过将这些作品进行翻译处理,能够提高阅读效率。目前,在互联网上存在的大量外文文件,这些外文文件包括可扩展标记语言(ExtensibleMarkupLanguage,XML),或是,超文本标记语言(HyperTextMarkupLanguage,HTML)格式。在现有技术中,对于外文文件的翻译的过程往往会对这些外文文件的格式等信息造成一定的影响,甚至对于一些图片或是网络链接等信息不能很好地还原出来,影响对于外文文件的翻译效率,以及翻译的准确度。
技术实现思路
有鉴于此,本申请实施例至少提供一种文本翻译方法、装置、计算机设备及存储介质,通过对外文文件中的文本部分进行处理,并回填至原始文件的方法,可以增加文本翻译的准确率,提高文本翻译的效率。本申请主要包括以下几个方面:第一方面,本申请实施例提供一种文本翻译方法,所述文本翻译方法包括:在获取到原始文件后,根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件;对所述待翻译文件进行解析,确定所述待翻译文件中的第一文本和其他文件信息,并记录所述第一文本与所述其他文件信息之间的相对位置信息;对所述第一文本进行翻译,得到翻译后的第二文本,并将所述相对位置信息确定为所述第二文本与所述其他文件信息之间的相对位置信息;根据所述第二文本、所述其他文件信息以及所述相对位置信息,生成所述待翻译文件对应的译文文件。在一种可能的实施方式中,所述标签信息包括第一起始标签信息和第一终止标签信息;所述根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件,包括:基于所述原始文件的第一起始标签信息以及第一终止标签信息,确定位于所述第一起始标签与所述第一终止标签之间的文件为所述待翻译文件。在一种可能的实施方式中,当所述原始文件中包括所述第一起始标签信息,但未包括第一终止标签信息时,所述根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件,包括:确定所述第一终止标签在所述原始文件中的添加位置,并在所述添加位置添加所述第一终止标签;将位于所述第一起始标签与所述第一终止标签之间的文件确定为所述待翻译文件。在一种可能的实施方式中,所述确定所述第一终止标签在所述原始文件中的添加位置,包括:从所述原始文件中查找与所述第一起始标签的相邻的第二起始标签信息;若所述原始文件中包括与所述第二起始标签信息对应第二终止标签信息,则根据第一起始标签以及所述第二起始标签,确定所述第一终止标签的添加位置。在一种可能的实施方式中,对所述待翻译文件进行解析,确定所述待翻译文件中的第一文本和其他文件信息,包括:基于文件识别方法,对所述待翻译文件进行解析,确定出所述待翻译文件中的多个文件信息;其中,所述文件信息包括以下至少之一:文本、图片、链接;提取所述待翻译文件中的文本信息为所述待翻译文件中的第一文本。在一种可能的实施方式中,所述根据所述第二文本、所述其他文件信息以及所述相对位置信息,生成所述待翻译文件对应的译文文件,包括:根据所述其他文件信息在所述原始文件的第一位置,确定所述其他文件信息在位置模板文件的第二位置,并在第二位置写入所述其他文件信息;基于所述其他文件信息在所述位置模板文件的第二位置以及相对位置信息,确定第三位置;在所述第三位置写入所述第二文本,生成所述待翻译文件对应的译文文件;或者,基于其他文件信息在原始文件中的位置和所述第二文本与所述其他文件信息之间的相对位置信息,利用所述第二文本替换所述第一文本,生成所述待翻译文件对应的译文文件。在一种可能的实施方式中,在所述原始文件包括多个所述待翻译文件时,所述翻译方法还包括:采用并行处理的方式,对多个所述待翻译文件进行解析,确定多个所述待翻译文件中的多个第一文本和其他文件信息,并记录多个所述第一文本与所述其他文件信息之间的相对位置信息;对多个所述第一文本进行翻译,得到多个翻译后的第二文本,并将所述相对位置信息确定为多个所述第二文本与所述其他文件信息之间的相对位置信息;根据多个所述第二文本、所述其他文件信息以及所述相对位置信息,生成多个所述待翻译文件对应的译文文件。第二方面,本申请实施例还提供一种文本翻译装置,所述文本翻译装置包括:第一确定模块,用于在获取到原始文件后,根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件;第二确定模块,用于对所述待翻译文件进行解析,确定所述待翻译文件中的第一文本和其他文件信息,并记录所述第一文本与所述其他文件信息之间的相对位置信息;翻译模块,用于对所述第一文本进行翻译,得到翻译后的第二文本,并将所述相对位置信息确定为所述第二文本与所述其他文件信息之间的相对位置信息;第一生成模块,用于根据所述第二文本、所述其他文件信息以及所述相对位置信息,生成所述待翻译文件对应的译文文件。在一种可能的实施方式中,所述标签信息包括第一起始标签信息和第一终止标签信息;所述第一确定模块具体用于:基于所述原始文件的第一起始标签信息以及第一终止标签信息,确定位于所述第一起始标签与所述第一终止标签之间的文件为所述待翻译文件。在一种可能的实施方式中,当所述原始文件中包括所述第一起始标签信息,但未包括第一终止标签信息时,所述第一确定模块包括:添加单元,用于确定所述第一终止标签在所述原始文件中的添加位置,并在所述添加位置添加所述第一终止标签;确定单元,用于将位于所述第一起始标签与所述第一终止标签之间的文件确定为所述待翻译文件。在一种可能的实施方式中,所述添加单元具体用于:从所述原始文件中查找与所述第一起始标签的相邻的第二起始标签信息;若所述原始文件中包括与所述第二起始标签信息对应第二终止标签信息,则根据第一起始标签以及所述第二起始标签,确定所述第一终止标签的添加位置。在一种可能的实施方式中,所述第二确定模块具体用于:基于文件识别方法,对所述待翻译文件进行解析,确定出所述待翻译文件中的多个文件信息;其中,所述文件信息包括以下至少之一:文本、图片、链接;提取所述待翻译文件中的文本信息为所述待翻译文件中的第一文本。在一种可能的实施方式中,所述第一生成模块具体用于:根据所述其他文件信息在所述原始文件的第一位置,确定所述其他文件信息在位置模板文件的第二位置,并在第二位置写入所述其他文件信息;基于所述其他文件信息在所述位置模板文件的第二位置以及相对位置信息,确定第三位置;在所述第三位置写入所述第二文本,生成所述待翻译文件对应的译文文件;本文档来自技高网...

【技术保护点】
1.一种文本翻译方法,其特征在于,所述文本翻译方法包括:/n在获取到原始文件后,根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件;/n对所述待翻译文件进行解析,确定所述待翻译文件中的第一文本和其他文件信息,并记录所述第一文本与所述其他文件信息之间的相对位置信息;/n对所述第一文本进行翻译,得到翻译后的第二文本,并将所述相对位置信息确定为所述第二文本与所述其他文件信息之间的相对位置信息;/n根据所述第二文本、所述其他文件信息以及所述相对位置信息,生成所述待翻译文件对应的译文文件。/n

【技术特征摘要】
1.一种文本翻译方法,其特征在于,所述文本翻译方法包括:
在获取到原始文件后,根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件;
对所述待翻译文件进行解析,确定所述待翻译文件中的第一文本和其他文件信息,并记录所述第一文本与所述其他文件信息之间的相对位置信息;
对所述第一文本进行翻译,得到翻译后的第二文本,并将所述相对位置信息确定为所述第二文本与所述其他文件信息之间的相对位置信息;
根据所述第二文本、所述其他文件信息以及所述相对位置信息,生成所述待翻译文件对应的译文文件。


2.根据权利要求1所述的文本翻译方法,其特征在于,所述标签信息包括第一起始标签信息和第一终止标签信息;
所述根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件,包括:
基于所述原始文件的第一起始标签信息以及第一终止标签信息,确定位于所述第一起始标签与所述第一终止标签之间的文件为所述待翻译文件。


3.根据权利要求2所述的文本翻译方法,其特征在于,当所述原始文件中包括所述第一起始标签信息,但未包括第一终止标签信息时,所述根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件,包括:
确定所述第一终止标签在所述原始文件中的添加位置,并在所述添加位置添加所述第一终止标签;
将位于所述第一起始标签与所述第一终止标签之间的文件确定为所述待翻译文件。


4.根据权利要求3所述的文本翻译方法,其特征在于,所述确定所述第一终止标签在所述原始文件中的添加位置,包括:
从所述原始文件中查找与所述第一起始标签的相邻的第二起始标签信息;
若所述原始文件中包括与所述第二起始标签信息对应第二终止标签信息,则根据第一起始标签以及所述第二起始标签,确定所述第一终止标签的添加位置。


5.根据权利要求1所述的文本翻译方法,其特征在于,对所述待翻译文件进行解析,确定所述待翻译文件中的第一文本和其他文件信息,包括:
基于文件识别方法,对所述待翻译文件进行解析,确定出所述待翻译文件中的多个文件信息;其中,所述文件信息包括以下至少之一:文本、图片、链接;
提取所述待翻译文件中的文本信息为所述待翻译文件中的第一文本。


6.根据权利要求1所述的文本翻译方法,其特征在于,所述根据所述第二文本、所述其他文件信息以及所述相对位置信息,生成所述待翻译文件对应的译文...

【专利技术属性】
技术研发人员:夏鹏张鑫李钢江马义
申请(专利权)人:南京百家云科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1