一种翻译方法、装置和用于翻译的装置制造方法及图纸

技术编号:25186244 阅读:17 留言:0更新日期:2020-08-07 21:13
本发明专利技术实施例提供了一种翻译方法、装置和用于翻译的装置。其中的方法具体包括:确定图像中的源语言文本行区域;若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。本发明专利技术实施例可以提高图像翻译的准确率。

【技术实现步骤摘要】
一种翻译方法、装置和用于翻译的装置
本专利技术涉及计算机
,尤其涉及一种翻译方法、装置和用于翻译的装置。
技术介绍
随着计算机技术的不断发展,利用翻译工具可以对图像中的文本进行翻译,将图像中的源语言文本翻译为目标语言文本,并且输出翻译后的图像。例如,参照图1,示出了一种待翻译图像的示意图,该图像中包括源语言为英文的如下源语言文本:“Chinaisleadingtheworldinfacialrecognitionalgorithmswithitsbestalgorithmabletorecognize10millionpeoplewithoutasinglemistakeinlessthanasecond.”,假设目标语言为中文,则该源语言文本对应的翻译结果可以如下:“中国的人脸识别算法在世界上处于领先地位,其中最好的算法能够在不到一秒的时间内识别出一千万人而不会出现任何错误。”然而,由于在图1所示的图像中,源语言文本分为被分为多个文本行显示,因此,翻译工具会对识别出的多个文本行分别进行翻译,最终输出如图2所示的翻译后的图像。用户最终看到的目标语言文本为:“中国在脸部世界领先”、“最佳识别算法”、“能够识别10的算法”、“百万人口”、“不到一秒钟的错误。”。可以看出,图2中的每一行目标语言文本虽然与图1中的每一行源语言文本相对应,但是,图2所示的目标语言文本与图1的源语言文本的语义偏差较大,不仅影响翻译的准确率,而且为用户的理解增加了难度。
技术实现思路
本专利技术实施例提供一种翻译方法、装置和用于翻译的装置,可以提高用户查看商品信息的效率。为了解决上述问题,本专利技术实施例公开了一种翻译方法,所述方法包括:确定图像中的源语言文本行区域;若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。另一方面,本专利技术实施例公开了一种翻译装置,所述装置包括:确定模块,用于确定图像中的源语言文本行区域;合并模块,用于若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;翻译模块,用于对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。再一方面,本专利技术实施例公开了一种用于翻译的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:确定图像中的源语言文本行区域;若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。又一方面,本专利技术实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的翻译方法。本专利技术实施例包括以下优点:本专利技术实施例在确定图像中的源语言文本行区域之后,进一步判断相邻的源语言文本行区域中是否包括同一个段落的文本内容,若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域,再对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。由于合并后得到的源语言文本段区域中的文本内容包括完整的段落,且合并后的段落包括完整的句子,由此,对合并后的源语言文本段区域中的源语言文本进行翻译,可以得到语义表达更加准确的目标语言文本,以提高翻译的准确率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是一种待翻译图像的示意图;图2是一种翻译后图像的示意图;图3是本专利技术的一种翻译方法实施例的步骤流程图;图4是本专利技术的一种源语言文本行区域的示意图;图5是本专利技术的另一种源语言文本行区域的示意图;图6是本专利技术的一种翻译装置实施例的结构框图;图7是本专利技术的一种用于翻译的装置800的框图;及图8是本专利技术的一些实施例中服务器的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。方法实施例参照图3,示出了本专利技术的一种翻译方法实施例的步骤流程图,具体可以包括如下步骤:步骤301、确定图像中的源语言文本行区域;步骤302、若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;步骤303、对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。本专利技术实施例可应用于翻译场景,所述翻译场景对应的翻译客户端可以根据用户设置的源语言以及目标语言的种类,将图像中的源语言文本翻译成目标语言文本。可以理解,本专利技术实施例对源语言和目标语言的种类不加以限制,例如,所述源语言可以为中文,所述目标语言可以为英文;或者,所述源语言可以为英文,所述目标语言可以为日文等。本专利技术实施例对所述翻译客户端的形式不加以限制,例如,所述翻译客户端可以为翻译APP(Application,应用程序),用户可以在终端中下载安装并使用该APP;或者,所述翻译客户端可以为网页在线工具,用户可以打开网页,使用网页中的在线翻译客户端等。所述翻译客户端可以运行在终端上,所述终端具体包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,MovingPictureExpertsGroupAudioLayerIII)播放器、MP4(动态影像专家压缩标准音频层面4,MovingPictureExpertsGroupAudioLayerIV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。在本专利技术实施例中,待翻译的所述图像可以是任意类型的图像,如商品图、细节图、画报封面图、广告图等,图像的格式包括但不限于JPG(JointPhotographicExpertsGroup,联合图像专家组)、PNG(PortableNetworkGraphics,便携式网络图形)、TIFF(TagImageFileFor本文档来自技高网...

【技术保护点】
1.一种翻译方法,其特征在于,所述方法包括:/n确定图像中的源语言文本行区域;/n若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;/n对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。/n

【技术特征摘要】
1.一种翻译方法,其特征在于,所述方法包括:
确定图像中的源语言文本行区域;
若确定相邻的源语言文本行区域中包括同一个段落的文本内容,则合并所述相邻的源语言文本行区域,以得到源语言文本段区域;
对所述源语言文本段区域中的源语言文本进行翻译,以得到所述源语言文本对应的目标语言文本。


2.根据权利要求1所述的方法,其特征在于,所述确定相邻的源语言文本行区域中包括同一个段落的文本内容,包括:
若相邻的源语言文本行区域的尺寸差异小于预设差异值、行间距小于预设间距值、以及相邻的源语言文本行区域中的文本方向相同,则确定相邻的源语言文本行区域中包括同一个段落的文本内容;其中,所述尺寸包括:所述源语言文本行区域的高度、和/或、所述源语言文本行区域的宽度。


3.根据权利要求1所述的方法,其特征在于,所述确定相邻的源语言文本行区域中包括同一个段落的文本内容,包括:
确定第一区域中文本行的末尾词,以及确定第二区域中文本行的起始词;其中,所述第一区域和所述第二区域为相邻的源语言文本行区域,且所述第一区域位于相邻源语言文本行区域中的第一位置,所述第二区域位于相邻源语言文本行区域中的第二位置;
若确定所述末尾词与所述起始词之间满足关联条件,则确定所述第一区域与所述第二区域中包括同一个段落的文本内容。


4.根据权利要求3所述的方法,其特征在于,所述确定所述末尾词与所述起始词之间满足关联条件,包括:
确定所述末尾词为句尾词的第一概率;
确定所述起始词为句首词的第二概率;
确定在所述末尾词出现的情况下,所述起始词出现的第三概率;
若所述第一概率小于第一阈值、所述第二概率小于第二阈值,且所述第三概率大于第三阈值,则确定所述末尾词与所述起始词之间满足关联条件。


5.根据权利要求3所述的方法,其特征在于,所述确定所述末尾词与所述起始词之间满足关联条件,包括:
若所述末尾词的...

【专利技术属性】
技术研发人员:张玉亭马龙
申请(专利权)人:搜狗杭州智能科技有限公司北京搜狗科技发展有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1