图像翻译方法及系统技术方案

技术编号:10525917 阅读:162 留言:0更新日期:2014-10-09 11:19
本发明专利技术提出一种图像翻译方法及系统,其中,该方法包括:获得图片,并从图片中确定出目标对象;向图片识别系统发送目标对象的图片,以使图片识别出目标对象所属的类型信息,并向翻译系统发送类型信息,以使翻译系统对类型信息进行翻译;以及接收并显示类型信息及其对应的译文。本发明专利技术实施例的图像翻译方法及系统,在获得用户输入的图片之后,可为用户同时提供图片对应的类型信息和译文,解决了用户有翻译需求时,无法获知当前物体是什么的问题,满足了用户基于图像进行翻译的需求。

【技术实现步骤摘要】
图像翻译方法及系统
本专利技术涉及计算机
,特别涉及一种图像翻译方法及系统。
技术介绍
随着经济的发展,对外交流的增多,在对外交流的过程中,为了获得在不同语言 之间的通信,需要在这些语言之间进行翻译,目前,互联网中为用户提供了多种翻译软件, 目前,用户常见的翻译软件主要有三种翻译方式,包括文本翻译、语音翻译和光学字符识别 (Optical Character Recognition,OCR)文字翻译,其中: 文本翻译是人们最早和最常用的一种翻译方式,用户在翻译软件提供的输入框中 输入需要翻译的文字,以及选择需要翻译的文字对应的目标语言后,点击翻译按钮,就可以 获得需要翻译文字对应的目标语言的译文。 语音翻译可以减少用户主动输入需要翻译的文字的操作,用户通过对着具有语音 翻译功能的翻译软件说话,翻译软件即可以识别出对应的文字,并通过翻译系统将用户需 要翻译的文字转换为用户需要的目标语言的译文。 OCR文本翻译能够识别书本或者图片中的文字,并根据用户设置的目标语言,通过 翻译系统将识别出的文字转换为目标语言对应的译文的一种翻译方式。 上述三种翻译方式均需要获得用户输入的原文,然而在某些情况下,用户不知当 前物体是什么时,用户无法通过现有的翻译软件获知当前物体对应的另一种语言的译文, 这主要是因为用户无法向具有文本翻译、语音翻译或者OCR文本翻译功能的翻译软件提供 翻译软件需要的该物品的文字表述、语音表述,因此,翻译软件无法完成翻译功能。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的 第一个目的在于提出一种图像翻译方法,该方法能够同时为用户提供图片对应的类型信息 和译文,解决了用户有翻译需求时,无法获知当前物体是什么的问题,满足了用户基于图像 进行翻译的需求。 本专利技术的第二个目的在于提出一种图像翻译系统。 为实现上述目的,本专利技术第一方面实施例的图像翻译方法,包括:S1、获得图片,并 从所述图片中确定出目标对象;S2、向图片识别系统发送所述目标对象的图片,以使所述图 片识别系统识别出所述目标对象所属的类型信息,并向翻译系统发送所述类型信息,以使 所述翻译系统对所述类型信息进行翻译;以及S3、接收并显示所述类型信息及所述类型信 息对应的译文。 根据本专利技术实施例的图像翻译方法,在确定图片中的目标对象后,向图片识别系 统发送目标对象的图片,以使图片识别系统识别出目标对象所属的类型信息,并向翻译系 统发送类型信息以使翻译系统对类型信息进行翻译,以及接收并显示类型信息及其对应的 译文,由此,提出了一种基于图像的图像翻译方式,在为用户提供图片识别功能的同时,提 供了翻译功能,解决了用户有翻译需求时,无法获知当前物体是什么的问题,满足了用户基 于图像进行翻译的需求。 为实现上述目的,本专利技术第二方面实施例的图像翻译系统,包括终端、图片识别系 统和翻译系统,其中:所述终端,用于获得图片,从所述图片中确定出目标对象;向所述图 片识别系统发送所述目标对象的图片,接收并显示类型信息及其对应的译文;所述图片识 别系统,用于对所述目标对象的图片进行识别,获得所述目标对象所属的类型信息,并向所 述翻译系统发送所述类型信息;所述翻译系统,用于对接收的所述类型信息进行翻译。 根据本专利技术实施例的图像翻译系统,终端获取图片中的目标对象,并将目标对象 的图片发送给图片识别系统,图片识别系统接收并识别出图片中的目标对象所属的类型信 息,并向翻译系统发送类型信息,以及翻译系统根据接收到的类型信息进行翻译,终端接收 并显示类型信息及其对应的译文,提出了一种基于图像的图像翻译方式,在为用户提供图 片识别功能的同时,提供了翻译功能,解决了用户有翻译需求时,无法获知当前物体是什么 的问题,满足了用户基于图像进行翻译的需求。 【附图说明】 图1是根据本专利技术一个实施例的图像翻译方法的流程图。 图2a是根据本专利技术一个实施例的图片的示意图一。 图2b是根据本专利技术一个实施例的圈选目标对象的示意图一。 图2c是根据本专利技术一个实施例的涂选目标对象的示意图一。 图2d是根据本专利技术一个实施例的显示类型信息及其对应的译文的页面的示意图 〇 图3是根据本专利技术一个实施例的用户分享界面的示意图。 图4a是根据本专利技术一个实施例的图片的示意图二。 图4b是根据本专利技术一个实施例的圈选目标对象的示意图二。 图4c是根据本专利技术一个实施例的涂选目标对象的示意图二。 图4d是根据本专利技术一个实施例的显示类型信息及其对应的译文的页面的示意图 --〇 图5是根据本专利技术另一个实施例的图像翻译方法的流程图。 图6a是根据本专利技术一个实施例的图片的示意图三。 图6b是根据本专利技术一个实施例的圈选目标对象的示意图三。 图6c是根据本专利技术一个实施例的涂选目标对象的示意图三。 图6d是根据本专利技术一个实施例的显示类型信息及其对应的译文的页面的示意图 ___ 〇 图7是根据本专利技术一个实施例的图像翻译系统的结构示意图。 【具体实施方式】 下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附 图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。 下面参考附图描述本专利技术实施例的图像翻译方法及系统。 图1是根据本专利技术一个实施例的图像翻译方法的流程图。 如图1所示,该图像翻译方法包括: S1、获得图片,并从图片中确定出目标对象。 具体地,在用户通过终端的摄像头拍摄图片后,可通过两种方式从图片中获得待 识别的目标对象,其中:第一种方式为圈选,圈选是指用户通过手指将图片中的目标对象圈 在一个包含目标对象的圆形、椭圆、长方形或者不规则的形状之内,例如,在用户通过终端 拍摄了一张如图2a所示的动物的图片后,用户可通过如图2b所示的圈选方式从图片中圈 选出待识别的动物。 第二种方式为涂选,涂选是指用户通过手指涂抹图片中待识别的目标对象,例如, 在用户通过终端拍摄了一张如图2a所示的动物的图片后,用户可通过如图2c所示的涂选 方式从图片中圈选出待识别的动物。 其中,上述终端可以为手机、平板电脑等具有摄像头模块的移动终端。上述目标对 象可以包括但不限于动物、植物、景点、食物和人物等,例如,用户在跟外国友人游览颐和园 时,当外国友人问用户当前的景点是什么时,若用户也不清楚当前的这些景点,此时,用户 可通过随身携带的智能手机拍摄一张景点图片进行识别和翻译。 S2、向图片识别系统发送目标对象的图片,以使图片识别系统识别出目标对象所 属的类型信息,并向翻译系统发送类型信息,以使翻译系统对类型信息进行翻译。 在终端获得用户从图片中圈选或者涂抹出的目标对象后,终端将获得的目标对象 的图片发送至图片识别系统,图片识别系统接收目标对象的图片后将对图片进行识别,以 确定该目标对象所所属的类型信息。其中,类型信息可以包括但不限于标签,并且目标对象 所属的类型信息是图片识别系统基于预设的识别模型获得的,其中,识别模本文档来自技高网...

【技术保护点】
一种图像翻译方法,其特征在于,包括:S1、获得图片,并从所述图片中确定出目标对象;S2、向图片识别系统发送所述目标对象的图片,以使所述图片识别系统识别出所述目标对象所属的类型信息,并向翻译系统发送所述类型信息,以使所述翻译系统对所述类型信息进行翻译;以及S3、接收并显示所述类型信息及所述类型信息对应的译文。

【技术特征摘要】
1. 一种图像翻译方法,其特征在于,包括: 51、 获得图片,并从所述图片中确定出目标对象; 52、 向图片识别系统发送所述目标对象的图片,以使所述图片识别系统识别出所述目 标对象所属的类型信息,并向翻译系统发送所述类型信息,以使所述翻译系统对所述类型 信息进行翻译;以及 53、 接收并显示所述类型信息及所述类型信息对应的译文。2. 根据权利要求1所述的方法,其特征在于,所述从所述图片中确定出目标对象,包 括: 获得用户从所述图片中圈选出的所述目标对象;或者 获得用户从所述图片中涂抹出的所述目标对象。3. 根据权利要求1所述的方法,其特征在于,所述目标对象所属的类型信息是所述图 片识别系统基于预设的识别模型获得的。4. 根据权利要求3所述的方法,其特征在于,所述识别模型包括神经网络模型,所述神 经网络模型包括卷积神经网络和全连接神经网络。5. 根据权利要求1所述的方法,其特征在于,所述译文为所述翻译系统基于翻译模型 生成的。6. 根据权利要求1-5任一权利要求所述的方法,其特征在于,所述类型信息包括标签。7. 根据权利要求6所述的方法,其特征在于,所述S3包括: 在对应于所述目标对象的显示界面上显示所述标签及所述标签对应的译文。8. 根据权利要求7所述的方法,其特征在于,所述在对应于所述目标对象的显示界面 上显示所述标签及其对应的译文之后,还包括: 显示第一切换键和/或第二切换键;以及 获得对所述第一切换键或所述第二切换键的触发操作,并根据所述触发操作切换显示 标签及所述标签对应的译文。9. 根据权利要求8所述的方法,其特征在于,还包括: 显示与所述类型信息对应的第一语音输出按钮,以用于根据用户对所述第一语音输出 按钮的触发操作输出对应的语音;和/或 显示与所述译文对应的第二语音输出按钮,以用于根据用户对所述第二语音输出按钮 的触发操作输出对应的语音。10. 根据权利要求9所述的方法,其特征在于,在所述S3之后,还包括: 通过网络向其他用户发送所述目标对象的类型信息及其译文。11. 一种图像翻译系统,其特征在于,包括终端、图片识别系统和翻译系统,其中: 所述终端,用于获得图片,从所述图片中确定出目标对象;向所述图片识别系统...

【专利技术属性】
技术研发人员:王帆高浩渊吴中勤刘璇吴华王海峰
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1