当前位置: 首页 > 专利查询>邹玉平专利>正文

图像处理的方法、相关装置以及系统制造方法及图纸

技术编号:24123523 阅读:24 留言:0更新日期:2020-05-13 03:50
本发明专利技术提供了一种图像处理的方法、相关装置以及系统,该方法包括:获取图像帧,每帧图像帧包括文本图像和工具图像;根据所述图像帧,获得所述工具图像所指示的工具的状态信息;根据所述工具的状态信息,确定所述文本图像中的目标区域;对所述目标区域对应的目标图像编辑或搜索查询,或,对所述目标图像中的目标字符进行识别/字体转换/语言翻译/搜索查询。本发明专利技术实施例的技术方案有利于通过工具获取目标图像,避免手工拍照、手工圈定等繁琐步奏,简化从书籍中获取目标图像的路径,更好的满足人们的需求。

Image processing methods, related devices and systems

【技术实现步骤摘要】
图像处理的方法、相关装置以及系统本申请要求于2019年1月25日提交中国专利局、申请号为201910072646.3、申请名称为“图像处理的方法、相关装置以及系统”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本专利技术涉及文本转化领域,尤其涉及一种图像处理的方法、相关装置以及系统。
技术介绍
生活中,人们经常需要将文本上的一些局部文字、图形、草稿以图像的形式进行分享或记录存储。现有技术中,对文本整体扫描或拍照之后,依赖触摸屏去手工圈定目标区域,再处理目标区域对应图像内容,步奏较多,或者要花费不少的时间调整焦距进行局部拍摄,操作复杂。由此可知,现有技术在图像的处理方面存在效率不高,从而使得用户体验较差。
技术实现思路
本专利技术实施例提供了图像处理方法、相关设备以及系统,实施本专利技术实施例,能提高目标图像处理的效率,进而提升用户的体验,满足用户的需求。第一方面,本专利技术实施例提供了一种用于图像处理的设备,所述设备包括:图像获取模块、工具信息获取模块、区域确定模块以及处理模块;其中,所述图像获取模块,用于获取图像帧,每帧图像帧包括文本图像和工具图像;所述工具信息获取模块,用于根据所述图像帧,获得所述工具图像所指示的工具的状态信息;其中,所述工具的状态信息为所述工具的静态特征或者所述工具的运动轨迹;所述工具的静态特征用于表示所述工具的属性,所述工具的静态特征包括纹路、颜色、横向形状、竖向形状、高度、光斑中的两种或两种以上的组合;所述区域确定模块,用于根据所述工具的状态信息,确定所述文本图像中的目标区域;所述处理模块,用于对所述目标区域对应的目标图像编辑或搜索查询,或,对所述目标图像中的目标字符进行识别/字体转换/语言翻译/搜索查询。可以看到,本专利技术实施例设备通过对工具状态信息的识别来确定目标图像所在的区域,再处理该区域中的目标图像,使得目标图像的处理具有区域导向性、易于实现。可以理解的是,工具作为指示性工具,对目标图像的指示使得对目标图像的处理具有方向性,因而使得目标图像的处理更简单高效,进而更能满足用户的需求、提升用户的体验。基于第一方面,在可能的实施方式中,在所述根据所述工具的状态信息,确定所述文本图像中的目标区域方面,所述区域确定模块具体用于:在所述工具的静态特征包括横向形状与竖向形状的组合的情况下,根据所述工具横向形状与竖向形状所形成的区域,确定所述文本图像中的目标区域;在所述工具的静态特征包括一种或多种有颜色的形状的情况下,根据所述工具的一种或多种特定颜色的形状所指向的区域或者一种或多种特定颜色的形状所形成的区域,确定所述文本图像中的目标区域;在所述工具的静态特征包括一种或多种有纹路的形状的情况下,根据所述工具的一种或多种特定纹路的形状所指向的区域或者一种或多种特定纹路的形状所形成的区域,确定所述文本图像中的目标区域;在所述工具的静态特征包括光斑,且所述光斑包括光点、光线条或者光区域中的至少一个的情况下,根据所述工具的光斑所指示的区域或者所述光斑所覆盖的区域,确定所述文本图像中的目标区域。基于第一方面,在可能的实施方式中,所述图像帧为多帧;在所述根据所述图像帧,获得所述工具图像所指示的工具的状态信息方面,所述工具信息获取模块具体用于:确定多帧所述图像帧中的每帧图像帧中的工具与所述每帧图像帧中的文本图像的标定位置之间的相对位置;根据所述每帧图像帧所确定的相对位置,获得所述工具相对所述标定位置的运动轨迹。基于第一方面,在可能的实施方式中,所述运动轨迹包括直线、类直线、非闭合曲线、闭合类曲线中的一种,或多种组合。基于第一方面,在可能的实施方式中,在所述根据所述工具的状态信息,确定所述文本图像中的目标区域方面,所述区域确定模块具体用于:当所述运动轨迹包括所述直线或者类直线时,确定位于所述直线或者类直线的第一侧或者第二侧的目标区域;当所述运动轨迹包括所述非闭合曲线时,确定位于所述非闭合曲线的第一侧或者第二侧的目标区域,或者,通过拟合处理所述非闭合曲线形成闭合曲线后,通过所述闭合曲线所形成的区域,确定所述文本图像中的目标区域;当所述运动轨迹包括所述闭合类曲线时,通过所述闭合曲线所形成的区域,确定所述文本图像中的目标区域,或者,通过拟合处理所述闭合曲线形成关联闭合曲线后,通过所述相关闭合曲线所形成的区域,确定所述文本图像中的目标区域。基于第一方面,在可能的实施方式中,所述目标区域包括以下至少一种:与所述工具邻近的、且容纳单个或多个文字的区域;与所述工具邻近的、且容纳单行或多行文字的区域;与所述工具邻近的、且容纳单列或多列文字的区域;与所述工具邻近的、且具有特定形状的区域,其中所述特定形状包括圆形、椭圆形、方形、矩形、梯形、菱形、多边形中的一种,或多种组合。基于第一方面,在可能的实施方式中,所述目标区域包括以下至少一种:在所述工具的静态特征所指示方向上的容纳单个或多个文字的区域;在所述工具的静态特征所指示方向上的容纳单行或多行文字的区域;在所述工具的静态特征所指示方向上的容纳单列或多列文字的区域;在所述工具的静态特征所指示方向上的具有特定形状的区域,其中所述特定形状包括圆形、椭圆形、方形、矩形、梯形、菱形、多边形中的一种,或多种组合。基于第一方面,在可能的实施方式中,所述设备包括终端或者服务器。第二方面,本专利技术实施例提供了一种用于图像处理的方法,所述方法包括:获取图像帧,每帧图像帧包括文本图像和工具图像;根据所述图像帧,获得所述工具图像所指示的工具的状态信息;其中,所述工具的状态信息为所述工具的静态特征或者所述工具的运动轨迹;所述工具的静态特征用于表示所述工具的属性,所述工具的静态特征包括纹路、颜色、横向形状、竖向形状、高度、光斑中的两种或两种以上的组合;根据所述工具的状态信息,确定所述文本图像中的目标区域;对所述目标区域对应的目标图像编辑或搜索查询,或者,对所述目标图像中的目标字符进行识别/字体转换/语言翻译/搜索查询。基于第二方面,在可能的实施方式中,所述根据所述工具的状态信息,确定所述文本图像中的目标区域,包括:在所述工具的静态特征包括横向形状与竖向形状的组合的情况下,根据所述工具横向形状与竖向形状所形成的区域,确定所述文本图像中的目标区域;在所述工具的静态特征包括一种或多种有颜色的形状的情况下,根据所述工具的一种或多种特定颜色的形状所指向的区域或者一种或多种特定颜色的形状所形成的区域,确定所述文本图像中的目标区域;在所述工具的静态特征包括一种或多种有纹路的形状的情况下,根据所述工具的一种或多种特定纹路的形状所指向的区域或者一种或多种特定纹路的形状所形成的区域,确定所述文本图像中的目标区域;在所述工具的静态特征包括光斑,且所述光斑包括光点、光线条或者光区域中的至少一个的情况下,根据所述工具的光斑所指示的区域或者所述光斑所覆盖的区域,确定所述文本图像中的目标区域。基于第二方面,在可能的实施方式中,所述图像帧为多帧;根据所述图像帧,获得所述工具图像所指示的工具的状态信息,具体包括:确定多帧所述图像帧中的每帧图像帧中的工具与所述每帧图本文档来自技高网...

【技术保护点】
1.一种用于图像处理的设备,其特征在于,所述设备包括:图像获取模块、工具信息获取模块、区域确定模块以及处理模块;其中,/n所述图像获取模块,用于获取图像帧,每帧图像帧包括文本图像和工具图像;/n所述工具信息获取模块,用于根据所述图像帧,获得所述工具图像所指示的工具的状态信息;其中,所述工具的状态信息为所述工具的静态特征或者所述工具的运动轨迹;所述工具的静态特征用于表示所述工具的属性,所述工具的静态特征包括纹路、颜色、横向形状、竖向形状、高度、光斑中的两种或两种以上的组合;/n所述区域确定模块,用于根据所述工具的状态信息,确定所述文本图像中的目标区域;/n所述处理模块,用于对所述目标区域对应的目标图像编辑或搜索查询,或,对所述目标图像中的目标字符进行识别/字体转换/语言翻译/搜索查询。/n

【技术特征摘要】
20190125 CN 20191007264631.一种用于图像处理的设备,其特征在于,所述设备包括:图像获取模块、工具信息获取模块、区域确定模块以及处理模块;其中,
所述图像获取模块,用于获取图像帧,每帧图像帧包括文本图像和工具图像;
所述工具信息获取模块,用于根据所述图像帧,获得所述工具图像所指示的工具的状态信息;其中,所述工具的状态信息为所述工具的静态特征或者所述工具的运动轨迹;所述工具的静态特征用于表示所述工具的属性,所述工具的静态特征包括纹路、颜色、横向形状、竖向形状、高度、光斑中的两种或两种以上的组合;
所述区域确定模块,用于根据所述工具的状态信息,确定所述文本图像中的目标区域;
所述处理模块,用于对所述目标区域对应的目标图像编辑或搜索查询,或,对所述目标图像中的目标字符进行识别/字体转换/语言翻译/搜索查询。


2.根据权利要求1所述的设备,其特征在于,在所述根据所述工具的状态信息,确定所述文本图像中的目标区域方面,所述区域确定模块具体用于:
在所述工具的静态特征包括横向形状与竖向形状的组合的情况下,根据所述工具横向形状与竖向形状所形成的区域,确定所述文本图像中的目标区域;
在所述工具的静态特征包括一种或多种有颜色的形状的情况下,根据所述工具的一种或多种特定颜色的形状所指向的区域或者一种或多种特定颜色的形状所形成的区域,确定所述文本图像中的目标区域;
在所述工具的静态特征包括一种或多种有纹路的形状的情况下,根据所述工具的一种或多种特定纹路的形状所指向的区域或者一种或多种特定纹路的形状所形成的区域,确定所述文本图像中的目标区域;
在所述工具的静态特征包括光斑,且所述光斑包括光点、光线条或者光区域中的至少一个的情况下,根据所述工具的光斑所指示的区域或者所述光斑所覆盖的区域,确定所述文本图像中的目标区域。


3.根据权利要求1所述的设备,其特征在于,所述图像帧为多帧;在所述根据所述图像帧,获得所述工具图像所指示的工具的状态信息方面,所述工具信息获取模块具体用于:
确定多帧述图像帧中的每帧图像帧中的工具与所述每帧图像帧中的文本图像的标定位置之间的相对位置;
根据所述每帧图像帧所确定的相对位置,获得所述工具相对所述标定位置的运动轨迹。


4.根据权利要求3所述的设备,其特征在于,所述运动轨迹包括直线、类直线、非闭合曲线、闭合类曲线中的一种,或多种组合。


5.根据权利要求4所述的设备,其特征在于,在所述根据所述工具的状态信息,确定所述文本图像中的目标区域方面,所述区域确定模块具体用于:
当所述运动轨迹包括所述直线或者类直线时,确定位于所述直线或者类直线的第一侧或者第二侧的目标区域;
当所述运动轨迹包括所述非闭合曲线时,确定位于所述非闭合曲线的第一侧或者第二侧的目标区域,或者,通过拟合处理所述非闭合曲线形成闭合曲线后,通过所述闭合曲线所形成的区域,确定所述文本图像中的目标区域;
当所述运动轨迹包括所述闭合类曲线时,通过所述闭合曲线所形成的区域,确定所述文本图像中的目标区域,或者,通过拟合处理所述闭合曲线形成关联闭合曲线后,通过所述相关闭合曲线所形成的区域,确定所述文本图像中的目标区域。


6.根据权利要求1或2所述的设备,其特征在于,所述目标区域包括以下至少一种:
与所述工具邻近的、且容纳单个或多个文字的区域;
与所述工具邻近的、且容纳单行或多行文字的区域;
与所述工具邻近的、且容纳单列或多列文字的区域;
与所述工具邻近的、且具有特定形状的区域,其中所述特定形状包括圆形、椭圆形、方形、矩形、梯形、菱形、多边形中的一种,或多种组合。


7.根据权利要求1或2所述的设备,其特征在于,所述目标区域包括以下至少一种:
在所述工具的静态特征所指示方向上的容纳单个或多个文字的区域;
在所述工具的静态特征所指示方向上的容纳单行或多行文字的区域;
在所述工具的静态特征所指示方向上的容纳单列或多列文字的区域;
在所述工具的静态特征所指示方向上的具有特定形状的区域,其中所述特定形状包括圆形、椭圆形、方形、矩形、梯形、菱形、多边形中的一种,或多种组合。


8.根据权利要求1-7任一项所述的设备,其特征在于,所述设备为终端或者服务器。


9.一种图像处理的方法,其特征在于,所述方法包括:
获取图像帧,每帧图像帧包括文本图像和工具图像;
根据所述图像帧,获得所述工具图像所指示的工具的状态信息;其中,所述工具的状态信息为所述工具的静态特征或者所述工具的运动轨迹;所述工具的静态特征用于表示所述工具的属性,所述工具的静态特征包括纹路、颜色、横向形状、竖向形状、高度、光斑中的两种或两种以上的组合;
根据所述工具的状态信息,确定所述文本图像中的目标区域;
对所述目标区域对应的目标图像编辑或搜索查询,或,对所述目标图像中的目标字符进行识别/字体转换/语言翻译/搜索查询。


10.根据权利要求9所述的方法,其特征在于,所述根据所述工具的状态信息,确定所述文本图像中的目标区域,包括:
在所述工具的静态特征包括横向形状与竖向形状的组合的情况下,根据所述工具横向形状与竖向形状所形成的区域,确定所述文本图像中的目标区域;
在所述工具的静态特征包括一种或多种有颜色的形状的情况下,根据所述工具的一种或多种特定颜色的形状所指向的区域或者一种或多种特定颜色的形状所形成的区域,确定所述文本图像中的目标区域;
在所述工具的静态特征包括一种或多种有纹路的形状的情况下,根据所述工具的一种或多种特定纹路的形状所指向的区域或者一种或多种特定纹路的形状所形成的区域,确定所述文本图像中的目标区域;
在所述工具的静态特征包括光斑,且所述光斑包括光点、光线条或者光区域中的至少一个的情况下,根据所述工具的光斑所指示的区域或者所述光斑所覆盖的区域,确定所述文本图像中的目标区域。


11.根据权利要求9所述的方法,其特征在于,所述图像帧为多帧;根据所述图像帧,获得所述工具图像所指示的工具的状态信息,具体包括:
确定多帧所述图像帧中的每帧图像帧中的工具与所述每帧图像帧中的文本图像的标定位置之间的相对位置;
根据所述每帧图像帧所确定的相对位置,获得所述工具相对所述标定位置的运动轨迹。


12.根据权利要求11所述的方法,其特征在于,所述运动轨迹包括直线、类直线、非闭合曲线、闭合类曲线中的一种,或多种组合。


13.根据权利要求12所述的方法,其特征在于,所述根据所述工具的状态信息,确定所述文本图像中的目标区域,包括:
当所述运动轨迹包括所述直线或者类直线时,确定位于所述直线或者类直线的第一侧或者第二侧的目标区域;
当所述运动轨迹包括所述非闭合曲线时,确定位于所述非闭合曲线的第一侧或者第二侧的目标区域,或者,通过拟合处理所述非闭合曲线形成闭合曲线后,通过所述闭合曲线所形成的区域,确定所述文本图像中的目标区域;
当所述运动轨迹包括所述闭合类曲线时,通过所述闭合曲线所形成的区域,确定所述文本图像中的目标区域,或者,通过拟合处理所述闭合曲线形成关联闭合曲线后,通过所述相关闭合曲线所形成的区域,确定所述文本图像中的目标区域。


14.根据权利要求9或10所述的方法,其特征在于,所述目标区域包括以下至少一种:
与所述工具邻近的、且容纳单个或多个文字的区域;
与所述工具邻近的、且容纳单行或多行文字的区域;
与所述工具邻近的、且容纳单列或多列文字的区域;
与所述工具邻近的、且具有特定形状的区域,其中所述特定形状包括圆形、椭圆形、方形、矩形、梯形、菱形、多边形中的一种,或多种组合。


15.根据权利要求9或10所述的方法,其特征在于,所述目标区域包括以下至少一种:
在所述工具的静态特征所指示方向上的容纳单个或多个文字的区域;
在所述工具的静态特征所指示方向上的容纳单行或多行文字的区域;
在所述工具的静态特征所指示方向上的容纳单列或多列文字的区域;
在所述工具的静态特征所指示方向上的具有特定形状的区域,其中所述特定形状包括圆形、椭圆形、方形、矩形、梯形、菱形、多边形中的一种,或多种组合。


16.根据权利要求9-15任一项所述的方法,其特征在于,所述方法应用于终端,所述方法包括:
终端获取图像帧,每帧图像帧包括文本图像和工具图像;
所述终端根据所述图像帧,获得所述工具图像所指示的工具的状态信息;其中,所述工具的状态信息为所述工具的静态特征或者所述工具的运动轨迹;所述工具的静态特征用于表示所述工具的属性,所述工具的静态特征包括纹路、颜色、横向形状、竖向形状、高度、光斑中的两种或两种以上的组合;
所述终端根据所述工具的状态信息,确定所述文本图像中的目标区域;
所述终端对所述目标区域对应的目标图像编辑或搜索查询,或,对所述目标图像中的目标字符进行识别/字体转换/语言翻译/搜索查询。


17.根据权利要求9-15任一项所述的方法,其特征在于,所述方法应用于服务器,所述方法包括:
服务器获取图像帧,每帧图像帧包括文本图像和工具图像;
所述服务器根据所述图像帧,获得所述工具图像所指示的工具的状态信息;其中,所述工具的状态信息为所述工具的静态特征或者所述工具的运动轨迹;所述工具的静态特征用于表示所述工具的属性,所述工具的静态特征包括纹路、颜色、横向形状、竖向形状、高度、光斑中的两种或两种以上的组合;
所述服务器根据所述工具的状态信息,确定所述文本图像中的目标区域;
所述服务器对所述目标区域对应的目标图像编辑或搜索查询,或,对所述目标图像中的目标字符进行识别/字体转换/语言翻译/搜索查询。


18.根据权利要求9-15任一项所述的方法,其特征在于,所述方法应用于系统,所述系统包括终端以及服务器,所述方法包括:
系统获取图像帧,每帧图像帧包括文本图像和工具图像;
所述系统根据所述图像帧,获得所述工具图像所指示的工具的状态信息;其中,所述工具的状态信息为所述工具的静态特征或者所述工具的运动轨迹;所述工具的静态特征用于表示所述工具的属性,所述工具的静态特征包括纹路、颜色、横向形状、竖向形状、高度、光斑中的两种或两种以上的组合;
所述系统根据所述工具的状态信息,确定所述文本图像中的目标区域;
所述系统对所述目标区域对应的目标图像编辑或搜索查询,或,对所述目标图像中的目标字符进行识别/字体转换/语言翻译/搜索查询。


19.一种用于图像处理的设备,其特征在于,所述设备包括:图像获取模块、工具信息获取模块、区域确定模块以及通信模块;其中,
所述图像获取模块,用于获取图像帧,每帧图像帧包括文本图像和工具图像;
所述工具信息获取模块,用于根据所述图像帧,获得所述工具图像所指示的工具的状态信息;其中,所述工具的状态信息为所述工具的静态特征或者所述工具的运动轨迹;所述工具的静态特征用于表示所述工具的属性,所述工具的静态特征包括纹路、颜色、横向形状、竖向形状、高度、光斑中的两种或两种以上的组合;
所述区域确定模块,用于根据所述工具的状态信息,确定所述文本图像中的目标区域;
所述通信模块用于,将所述文本图像中的目标区域发送至服务器,以使所述服务器根据所述文本图像中的目标区域得到处理结果,所述处理结果包括对所述目标区域对应的目标图像编辑或搜索查询,或,对所述目标图像中的目标字符进行识别/字体转换/语言翻译/搜索查询所得到的结果;
所述通信模块还用于,接收所述处理结果。


20.根据权利要求19所述的设备,其特征在于,在所述根据所述工具的状态信息,确定所述文本图像中的目标区域方面,所述区域确定模块具体用于:
在所述工具的静态特征包括横向形状与竖向形状的组合的情况下,根据所述工具横向形状与竖向形状所形成的区域,确定所述文本图像中的目标区域;

【专利技术属性】
技术研发人员:邹玉平
申请(专利权)人:邹玉平
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1