用于处理图像的方法和装置制造方法及图纸

技术编号:25950369 阅读:14 留言:0更新日期:2020-10-17 03:42
本公开的实施例公开了用于处理图像的方法和装置。该方法的一具体实施方式包括:获取待处理图像,其中,待处理图像包含属于第一语言的第一文字对象;对第一文字对象进行识别,生成第一文字对象指示的第一文字;对第一文字进行翻译,生成属于第二语言的第二文字;将第二文字与待处理图像进行融合,生成处理后图像。该实施方式丰富了图像的处理方式,有助于提高对图像中的文字对象进行翻译从而生成文字翻译后的图像的速度。

【技术实现步骤摘要】
用于处理图像的方法和装置
本公开的实施例涉及计算机
,具体涉及用于处理图像的方法和装置。
技术介绍
现有技术中,往往通过包含文字对象的图像来对网站上的产品进行介绍。用于呈现上述图像的页面通常被称为详情页。然而,不同国家的用户所使用的语言和文字通常也是不同的,例如,面向中国用户的产品的详情页中的图像通常包含中文,而该产品的详情页在向海外用户进行呈现时,通常需要将图像中的中文进行翻译。目前,通常采用人工翻译的方式,对图像中的文字进行翻译。例如,将包含文字的图像交给翻译公司,由公司的翻译人员进行人工图像处理,然后,将翻译好的图像再写回网站平台。
技术实现思路
本公开提出了用于处理图像的方法和装置。第一方面,本公开的实施例提供了一种用于处理图像的方法,该方法包括:获取待处理图像,其中,待处理图像包含属于第一语言的第一文字对象;对第一文字对象进行识别,生成第一文字对象指示的第一文字;对第一文字进行翻译,生成属于第二语言的第二文字;将第二文字与待处理图像进行融合,生成处理后图像。在一些实施例中,将第二文字与待处理图像进行融合,包括:基于待处理图像中的第一文字对象的第一样式信息,确定第二文字的第二样式信息,其中,第一样式信息用于指示第一文字的样式,第二样式信息用于指示第二文字的样式;按照第二样式信息指示的样式,将第二文字融合于待处理图像中第一文字对象所在的位置。在一些实施例中,第一样式信息和第二样式信息分别包括字号;以及基于待处理图像中的第一文字对象的第一样式信息,确定第二文字的第二样式信息,包括:基于第一文字对象的字号和字符数,确定包含第一文字对象的目标文本框;基于目标文本框所在的图像区域和第二文字的字符数,确定第二文字的字号。在一些实施例中,基于目标文本框所在的图像区域和第二文字的字符数,确定第二文字的字号,包括:基于第二文字的字符数和第一文字对象的字号,确定用于呈现第二文字的图像区域;响应于用于呈现第二文字的图像区域大于目标文本框所在的图像区域,减小第一文字对象的字号,将减小后的字号确定为第二文字的字号;响应于用于呈现第二文字的图像区域小于目标文本框所在的图像区域,增大第一文字对象的字号,将增大后的字号确定为第二文字的字号。在一些实施例中,将第二文字与待处理图像进行融合,包括:确定包含第一文字对象的目标文本框的位置;基于位置,将第二文字融合于目标文本框内。在一些实施例中,该方法还包括以下至少一项:响应于检测到针对目标文本框的点击操作,变更目标文本框的当前呈现样式;响应于检测到针对目标文本框的移动操作,按照移动操作的指示,对目标文本框和第二文字进行移动;响应于检测到针对目标文本框的缩放操作,按照缩放操作的指示,对目标文本框和第二文字进行缩放。在一些实施例中,将第二文字与待处理图像进行融合,包括:确定待处理图像中第一文字对象所在的位置;对待处理图像中的第一文字对象进行文字擦除处理,得到擦除后图像;将第二文字融合于擦除后图像中与第一文字对象所在的位置相应的位置处。在一些实施例中,对第一文字进行翻译,生成属于第二语言的第二文字,包括:将第一文字输入至预先训练的翻译模型,生成属于第二语言的第二文字,其中,翻译模型用于将输入的属于第一语言的文字翻译为属于第二语言的文字;以及翻译模型采用如下步骤训练得到:获取训练样本集合,其中,训练样本集合中的训练样本包括属于第一语言的文字和对属于第一语言的文字进行翻译得到的属于第二语言的文字;采用机器学习算法,将训练样本集合中的训练样本中的属于第一语言的文字作为输入数据,将对应输入数据的属于第二语言的文字作为期望输出数据,训练得到翻译模型。在一些实施例中,该方法还包括:响应于检测到针对第二文字的文字修改操作,对第二文字进行修改,将修改后的文字作为新的第二文字;将与新的第二文字对应的第一文字作为翻译模型的输入数据,将新的第二文字作为翻译模型的期望输出数据,训练得到新的翻译模型。在一些实施例中,第一样式信息和第二样式信息分别包括字体、颜色、字号、对齐方式、字体粗细中的至少一项。第二方面,本公开的实施例提供了一种用于处理图像的装置,该装置包括:获取单元,被配置成获取待处理图像,其中,待处理图像包含属于第一语言的第一文字对象;识别单元,被配置成对第一文字对象进行识别,生成第一文字对象指示的第一文字;翻译单元,被配置成对第一文字进行翻译,生成属于第二语言的第二文字;融合单元,被配置成将第二文字与待处理图像进行融合,生成处理后图像。在一些实施例中,融合单元包括:第一确定子单元,被配置成基于待处理图像中的第一文字对象的第一样式信息,确定第二文字的第二样式信息,其中,第一样式信息用于指示第一文字的样式,第二样式信息用于指示第二文字的样式;融合子单元,被配置成按照第二样式信息指示的样式,将第二文字融合于待处理图像中第一文字对象所在的位置。在一些实施例中,第一样式信息和第二样式信息分别包括字号;以及第一确定子单元包括:第一确定模块,被配置成基于第一文字对象的字号和字符数,确定包含第一文字对象的目标文本框;第二确定模块,被配置成基于目标文本框所在的图像区域和第二文字的字符数,确定第二文字的字号。在一些实施例中,第二确定模块包括:第一确定子模块,被配置成基于第二文字的字符数和第一文字对象的字号,确定用于呈现第二文字的图像区域;第二确定子模块,被配置成响应于用于呈现第二文字的图像区域大于目标文本框所在的图像区域,减小第一文字对象的字号,将减小后的字号确定为第二文字的字号;第三确定子模块,被配置成响应于用于呈现第二文字的图像区域小于目标文本框所在的图像区域,增大第一文字对象的字号,将增大后的字号确定为第二文字的字号。在一些实施例中,融合单元包括:第二确定子单元,被配置成确定包含第一文字对象的目标文本框的位置;第一融合子单元,被配置成基于位置,将第二文字融合于目标文本框内。在一些实施例中,该装置还包括以下至少一项:变更单元,被配置成响应于检测到针对目标文本框的点击操作,变更目标文本框的当前呈现样式;移动单元,被配置成响应于检测到针对目标文本框的移动操作,按照移动操作的指示,对目标文本框和第二文字进行移动;缩放单元,被配置成响应于检测到针对目标文本框的缩放操作,按照缩放操作的指示,对目标文本框和第二文字进行缩放。在一些实施例中,融合单元包括:第三确定子单元,被配置成确定待处理图像中第一文字对象所在的位置;擦除子单元,被配置成对待处理图像中的第一文字对象进行文字擦除处理,得到擦除后图像;第二融合子单元,被配置成将第二文字融合于擦除后图像中与第一文字对象所在的位置相应的位置处。在一些实施例中,翻译单元包括:生成子单元,被配置成将第一文字输入至预先训练的翻译模型,生成属于第二语言的第二文字,其中,翻译模型用于将输入的属于第一语言的文字翻译为属于第二语言的文字;以及翻译模型采用如下步骤训练得到:获取训练样本集合,其中,训练样本集合中的训练样本包括属于第一语言的文字和对属于第一语言的文字进行翻本文档来自技高网...

【技术保护点】
1.一种用于处理图像的方法,包括:/n获取待处理图像,其中,所述待处理图像包含属于第一语言的第一文字对象;/n对所述第一文字对象进行识别,生成所述第一文字对象指示的第一文字;/n对所述第一文字进行翻译,生成属于第二语言的第二文字;/n将所述第二文字与所述待处理图像进行融合,生成处理后图像。/n

【技术特征摘要】
1.一种用于处理图像的方法,包括:
获取待处理图像,其中,所述待处理图像包含属于第一语言的第一文字对象;
对所述第一文字对象进行识别,生成所述第一文字对象指示的第一文字;
对所述第一文字进行翻译,生成属于第二语言的第二文字;
将所述第二文字与所述待处理图像进行融合,生成处理后图像。


2.根据权利要求1所述的方法,其中,所述将所述第二文字与所述待处理图像进行融合,包括:
基于所述待处理图像中的所述第一文字对象的第一样式信息,确定所述第二文字的第二样式信息,其中,所述第一样式信息用于指示所述第一文字的样式,所述第二样式信息用于指示所述第二文字的样式;
按照所述第二样式信息指示的样式,将所述第二文字融合于所述待处理图像中所述第一文字对象所在的位置。


3.根据权利要求2所述的方法,其中,所述第一样式信息和所述第二样式信息分别包括字号;以及
所述基于所述待处理图像中的所述第一文字对象的第一样式信息,确定所述第二文字的第二样式信息,包括:
基于所述第一文字对象的字号和字符数,确定包含所述第一文字对象的目标文本框;
基于所述目标文本框所在的图像区域和所述第二文字的字符数,确定所述第二文字的字号。


4.根据权利要求3所述的方法,其中,所述基于所述目标文本框所在的图像区域和所述第二文字的字符数,确定所述第二文字的字号,包括:
基于所述第二文字的字符数和所述第一文字对象的字号,确定用于呈现所述第二文字的图像区域;
响应于所述用于呈现所述第二文字的图像区域大于所述目标文本框所在的图像区域,减小所述第一文字对象的字号,将减小后的字号确定为所述第二文字的字号;
响应于所述用于呈现所述第二文字的图像区域小于所述目标文本框所在的图像区域,增大所述第一文字对象的字号,将增大后的字号确定为所述第二文字的字号。


5.根据权利要求1所述的方法,其中,所述将所述第二文字与所述待处理图像进行融合,包括:
确定包含所述第一文字对象的目标文本框的位置;
基于所述位置,将所述第二文字融合于所述目标文本框内。


6.根据权利要求5所述的方法,其中,所述方法还包括以下至少一项:
响应于检测到针对所述目标文本框的点击操作,变更所述目标文本框的当前呈现样式;
响应于检测到针对所述目标文本框的移动操作,按照所述移动操作的指示,对所述目标文本框和所述第二文字进行移动;
响应于检测到针对所述目标文本框的缩放操作,按照所述缩放操作的指示,对所述目标文本框和所...

【专利技术属性】
技术研发人员:刘程雨桂创华刘海锋王培轩许亮秦慧娟
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1