【技术实现步骤摘要】
一种实现移动终端近距离提取文字的方法及系统
本专利技术属于图像处理和文字提取
,涉及一种实现移动终端近距离提取文字的方法及系统。
技术介绍
随着智能移动设备的广泛普及,文字识别技术越来越多应用到带有图像扫描或摄像功能的智能移动设备上,使得智能移动终端也能实现文字识别。以往的文字提取方法中,是通过摄像头将带有欲识别文字的页面在显示屏显示出来,需要用户移动屏幕上的光标,通过光标来定位待识别字符区域,再对待识别字符区域进行文字提取,但是这种必须用户一手持着智能移动终端,另一只手移动光标进行定位,操作麻烦,文字提取效率低。所以,为了克服上述文字识别方法的缺陷,现有的文字识别方法是将整个页面中的文本区域提取出来,但是采用这种方法,用户只能得到大片页面的文字信息,无法指定所提取的文本区域,也就无法精确获取某一词汇的文字信息,而当户需要提取的某一特定文字区域,就必须先要将摄像头近距离拍摄页面,使得所需提取的文字信息在显示屏上变得足够大,这样才能提取某个词语的文字信息,但由于现有的带有摄像功能的智能移动设备的镜头变焦范围是有限的,因此这种文字提取方法必须要在智能移动设备和页面保持在较远的距离(变焦范围内)下才能获取清晰的图像,一旦摄像头和页面的距离小于摄像头的变焦范围,摄像头就会失焦,无法获得清晰的图像,影响对文字准确性。因此,现有文字提取方法存在无法兼顾提取文字信息的高效性和准确性的问题。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种实现移动终端近距离提取文字的方 ...
【技术保护点】
1.一种实现移动终端近距离提取文字的方法,其特征在于,该方法的步骤包括:打开摄像头,获取含有用户欲识别文字内容的图像,并将所获取的图像显示到屏幕上;/n利用惯性测量单元实时获取移动终端的运动信息,根据移动终端的运动信息对屏幕所显示的图像进行几何变换,并在屏幕上实时显示几何变换后的图像;/n提取所显示图像中落入屏幕上待识别区的文字信息。/n
【技术特征摘要】
1.一种实现移动终端近距离提取文字的方法,其特征在于,该方法的步骤包括:打开摄像头,获取含有用户欲识别文字内容的图像,并将所获取的图像显示到屏幕上;
利用惯性测量单元实时获取移动终端的运动信息,根据移动终端的运动信息对屏幕所显示的图像进行几何变换,并在屏幕上实时显示几何变换后的图像;
提取所显示图像中落入屏幕上待识别区的文字信息。
2.根据权利要求1所述实现移动终端近距离提取文字的方法,其特征在于,所述根据移动终端的运动信息对屏幕所显示的图像进行几何变换是指根据移动终端的运动信息对屏幕所显示的图像进行平移变换、缩放变换和旋转变换。
3.根据权利要求2所述实现移动终端近距离提取文字的方法,其特征在于,所述运动信息包括当前移动设备的姿态信息以及当前移动设备的加速度a和/或角速度w。
4.根据权利要求1-3任一项所述实现移动终端近距离提取文字的方法,其特征在于,
所述提取所显示图像中落入屏幕上待识别区的文字信息,具体为:
确定所显示图像落入屏幕上待识别区的文本区域为信息提取区域;
将信息提取区域所在的图像进行透视变换调整为正面图像;
提取正面图像中信息提取区域的文字信息。
5.根据权利要求1-3任一项所述实现移动终端近距离提取文字的方法,其特征在于,所述获取含有用户欲识别文字内容的图像,并将所获取的图像显示到屏幕上,具体为:
拍摄对焦清晰的第一图像,屏幕显示第一图像;
当惯性测量单元检测到移动终端在运动时,控制摄像头在图像采集周期内采集与第一图像相邻的第二图像,其中第一图像和第二图像具有重叠部分;
所述利用惯性测量单元实时获取移动终端的运动信息,根据移动终端的运动信息对屏幕所显示的图像进行几何变换,具体为:
利用惯性测量单元实时获取移动终端的运动信息,根据移动终端的运动信息对屏幕所显示的第一图像进行几何变换,同时结合惯性测量单元判断当前移动终端的摄像头是否移动到第一图像的边缘;
若否,屏幕实时显示几何变换后的第一图像;
若是,对第一图像和第二图像进行拼接得到第三图像,将屏幕所显示的图像切换为第三图像,继续根据当前移动终端的运动信息对第三图像进行几何变换,屏幕实时显示几何变换后的第三图像;
所述提取所显示图像中落入屏幕上待识别区的文字信息,具体为:
当屏幕显示的图像为几何变换后的第一图像时,提取第一图像中落入屏幕上待识别区的文字信息;
当屏幕显示的图像为几何变换后的第三图像时,提...
【专利技术属性】
技术研发人员:宗毅,段志超,任柏成,
申请(专利权)人:北京三缘聚科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。