【技术实现步骤摘要】
一种文本翻译方法、装置、计算机设备及存储介质
本申请涉及文字处理
,尤其涉及一种文本翻译方法、装置、计算机设备及存储介质。
技术介绍
随着全球化的发展以及世界文化的交融,越来越多的外文文件通过互联网进行分享,但是,由于语言的关系,针对用户外文文件的阅读效率低,因此,通过将这些作品进行翻译处理,能够提高阅读效率。目前,在互联网上存在的大量外文文件,这些外文文件包括可扩展标记语言(ExtensibleMarkupLanguage,XML),或是,超文本标记语言(HyperTextMarkupLanguage,HTML)格式。在现有技术中,对于外文文件的翻译的过程往往会对这些外文文件的格式等信息造成一定的影响,甚至对于一些图片或是网络链接等信息不能很好地还原出来,影响对于外文文件的翻译效率,以及翻译的准确度。
技术实现思路
有鉴于此,本申请实施例至少提供一种文本翻译方法、装置、计算机设备及存储介质,通过对外文文件中的文本部分进行处理,并回填至原始文件的方法,可以增加文本翻译的准确率,提高文本翻译的效率。本申请主要包括以下几个方面:第一方面,本申请实施例提供一种文本翻译方法,所述文本翻译方法包括:在获取到原始文件后,根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件;对所述待翻译文件进行解析,确定所述待翻译文件中的第一文本和其他文件信息,并记录所述第一文本与所述其他文件信息之间的相对位置信息;对所述第一文本进行翻译,得到翻译后的第二文本,并将所 ...
【技术保护点】
1.一种文本翻译方法,其特征在于,所述文本翻译方法包括:/n在获取到原始文件后,根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件;/n对所述待翻译文件进行解析,确定所述待翻译文件中的第一文本和其他文件信息,并记录所述第一文本与所述其他文件信息之间的相对位置信息;/n对所述第一文本进行翻译,得到翻译后的第二文本,并将所述相对位置信息确定为所述第二文本与所述其他文件信息之间的相对位置信息;/n根据所述第二文本、所述其他文件信息以及所述相对位置信息,生成所述待翻译文件对应的译文文件。/n
【技术特征摘要】
1.一种文本翻译方法,其特征在于,所述文本翻译方法包括:
在获取到原始文件后,根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件;
对所述待翻译文件进行解析,确定所述待翻译文件中的第一文本和其他文件信息,并记录所述第一文本与所述其他文件信息之间的相对位置信息;
对所述第一文本进行翻译,得到翻译后的第二文本,并将所述相对位置信息确定为所述第二文本与所述其他文件信息之间的相对位置信息;
根据所述第二文本、所述其他文件信息以及所述相对位置信息,生成所述待翻译文件对应的译文文件。
2.根据权利要求1所述的文本翻译方法,其特征在于,所述标签信息包括第一起始标签信息和第一终止标签信息;
所述根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件,包括:
基于所述原始文件的第一起始标签信息以及第一终止标签信息,确定位于所述第一起始标签与所述第一终止标签之间的文件为所述待翻译文件。
3.根据权利要求2所述的文本翻译方法,其特征在于,当所述原始文件中包括所述第一起始标签信息,但未包括第一终止标签信息时,所述根据所述原始文件的标签信息,确定所述原始文件中的待翻译文件,包括:
确定所述第一终止标签在所述原始文件中的添加位置,并在所述添加位置添加所述第一终止标签;
将位于所述第一起始标签与所述第一终止标签之间的文件确定为所述待翻译文件。
4.根据权利要求3所述的文本翻译方法,其特征在于,所述确定所述第一终止标签在所述原始文件中的添加位置,包括:
从所述原始文件中查找与所述第一起始标签的相邻的第二起始标签信息;
若所述原始文件中包括与所述第二起始标签信息对应第二终止标签信息,则根据第一起始标签以及所述第二起始标签,确定所述第一终止标签的添加位置。
5.根据权利要求1所述的文本翻译方法,其特征在于,对所述待翻译文件进行解析,确定所述待翻译文件中的第一文本和其他文件信息,包括:
基于文件识别方法,对所述待翻译文件进行解析,确定出所述待翻译文件中的多个文件信息;其中,所述文件信息包括以下至少之一:文本、图片、链接;
提取所述待翻译文件中的文本信息为所述待翻译文件中的第一文本。
6.根据权利要求1所述的文本翻译方法,其特征在于,所述根据所述第二文本、所述其他文件信息以及所述相对位置信息,生成所述待翻译文件对应的译文...
【专利技术属性】
技术研发人员:夏鹏,张鑫,李钢江,马义,
申请(专利权)人:南京百家云科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。