一种实现移动终端近距离提取文字的方法及系统技术方案

技术编号：28624929 阅读：22 留言：0更新日期：2021-05-28 16:21

本发明专利技术提供一种实现移动终端近距离提取文字的方法及系统，该方法的步骤包括：打开摄像头，获取含有用户欲识别文字内容的图像，并将所获取的图像显示到屏幕上；利用惯性测量单元实时获取移动终端的运动信息，根据移动终端的运动信息对屏幕所显示的图像进行几何变换，并在屏幕上实时显示几何变换后的图像；提取所显示图像中落入屏幕上待识别区的文字信息。本发明专利技术通过预先拍摄下来的图像配合当前移动终端的运动信息来模拟摄像头的实时画面，屏幕给用户展示的图像不会因为摄像头与被拍摄物的距离过近而出现失焦导致的模糊，用户只需要单手控制移动终端就可以指定需要提取的文字部分，并且可以实现连续的文字提取，有效提高了文字提取的效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种实现移动终端近距离提取文字的方法及系统
本专利技术属于图像处理和文字提取
，涉及一种实现移动终端近距离提取文字的方法及系统。
技术介绍
随着智能移动设备的广泛普及，文字识别技术越来越多应用到带有图像扫描或摄像功能的智能移动设备上，使得智能移动终端也能实现文字识别。以往的文字提取方法中，是通过摄像头将带有欲识别文字的页面在显示屏显示出来，需要用户移动屏幕上的光标，通过光标来定位待识别字符区域，再对待识别字符区域进行文字提取，但是这种必须用户一手持着智能移动终端，另一只手移动光标进行定位，操作麻烦，文字提取效率低。所以，为了克服上述文字识别方法的缺陷，现有的文字识别方法是将整个页面中的文本区域提取出来，但是采用这种方法，用户只能得到大片页面的文字信息，无法指定所提取的文本区域，也就无法精确获取某一词汇的文字信息，而当户需要提取的某一特定文字区域，就必须先要将摄像头近距离拍摄页面，使得所需提取的文字信息在显示屏上变得足够大，这样才能提取某个词语的文字信息，但由于现有的带有摄像功能的智能移动设备的镜头变焦范围是有限的，因此这种文字提取方法必须要在智能移动设备和页面保持在较远的距离(变焦范围内)下才能获取清晰的图像，一旦摄像头和页面的距离小于摄像头的变焦范围，摄像头就会失焦，无法获得清晰的图像，影响对文字准确性。因此，现有文字提取方法存在无法兼顾提取文字信息的高效性和准确性的问题。
技术实现思路
本专利技术的目的在于针对现有技术的不足，提供一种实现移动终端近距离提取文字的方...

【技术保护点】
1.一种实现移动终端近距离提取文字的方法，其特征在于，该方法的步骤包括：打开摄像头，获取含有用户欲识别文字内容的图像，并将所获取的图像显示到屏幕上；/n利用惯性测量单元实时获取移动终端的运动信息，根据移动终端的运动信息对屏幕所显示的图像进行几何变换，并在屏幕上实时显示几何变换后的图像；/n提取所显示图像中落入屏幕上待识别区的文字信息。/n

【技术特征摘要】
1.一种实现移动终端近距离提取文字的方法，其特征在于，该方法的步骤包括：打开摄像头，获取含有用户欲识别文字内容的图像，并将所获取的图像显示到屏幕上；
利用惯性测量单元实时获取移动终端的运动信息，根据移动终端的运动信息对屏幕所显示的图像进行几何变换，并在屏幕上实时显示几何变换后的图像；
提取所显示图像中落入屏幕上待识别区的文字信息。

2.根据权利要求1所述实现移动终端近距离提取文字的方法，其特征在于，所述根据移动终端的运动信息对屏幕所显示的图像进行几何变换是指根据移动终端的运动信息对屏幕所显示的图像进行平移变换、缩放变换和旋转变换。

3.根据权利要求2所述实现移动终端近距离提取文字的方法，其特征在于，所述运动信息包括当前移动设备的姿态信息以及当前移动设备的加速度a和/或角速度w。

4.根据权利要求1-3任一项所述实现移动终端近距离提取文字的方法，其特征在于，
所述提取所显示图像中落入屏幕上待识别区的文字信息，具体为：
确定所显示图像落入屏幕上待识别区的文本区域为信息提取区域；
将信息提取区域所在的图像进行透视变换调整为正面图像；
提取正面图像中信息提取区域的文字信息。

5.根据权利要求1-3任一项所述实现移动终端近距离提取文字的方法，其特征在于，所述获取含有用户欲识别文字内容的图像，并将所获取的图像显示到屏幕上，具体为：
拍摄对焦清晰的第一图像，屏幕显示第一图像；
当惯性测量单元检测到移动终端在运动时，控制摄像头在图像采集周期内采集与第一图像相邻的第二图像，其中第一图像和第二图像具有重叠部分；
所述利用惯性测量单元实时获取移动终端的运动信息，根据移动终端的运动信息对屏幕所显示的图像进行几何变换，具体为：
利用惯性测量单元实时获取移动终端的运动信息，根据移动终端的运动信息对屏幕所显示的第一图像进行几何变换，同时结合惯性测量单元判断当前移动终端的摄像头是否移动到第一图像的边缘；
若否，屏幕实时显示几何变换后的第一图像；
若是，对第一图像和第二图像进行拼接得到第三图像，将屏幕所显示的图像切换为第三图像，继续根据当前移动终端的运动信息对第三图像进行几何变换，屏幕实时显示几何变换后的第三图像；
所述提取所显示图像中落入屏幕上待识别区的文字信息，具体为：
当屏幕显示的图像为几何变换后的第一图像时，提取第一图像中落入屏幕上待识别区的文字信息；
当屏幕显示的图像为几何变换后的第三图像时，提...

【专利技术属性】
技术研发人员：宗毅，段志超，任柏成，
申请(专利权)人：北京三缘聚科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人