当前位置: 首页 > 专利查询>浙江大学专利>正文

面向便携式计算设备的快速文本扫读方法技术

技术编号:8656162 阅读:245 留言:0更新日期:2013-05-01 23:52
本发明专利技术公开了一种面向便携式计算设备的快速文本扫读方法,其实施步骤如下:1)图像预处理:通过面向便携式计算设备的摄像头捕获包含文本的图片,然后将捕获的图片依次通过旋转矫正、检测提取文本区域,得到以行为单位的文本区域数据集;2)文本识别及语音输出:调用OCR引擎对以行为单位的文本数据集进行文本识别;同时对OCR识别速度进行预估,根据预估结果调节TTS播报速率;在进行文本识别的同时,将识别出来的以行为单位的文字信息和所述TTS播报速率发给TTS引擎以声音的形式反馈给用户。本发明专利技术具有文字识别速度快、识别准确率高、语音输出智能、用户等待时间少、用户使用体验好的优点。

【技术实现步骤摘要】

本专利技术涉及计算机数字图像处理领域,具体涉及一种。
技术介绍
随着手机等便携式计算设备的快速普及化,便携式计算设备得到了快速的发展。但相比于硬件的快速发展,软件的发展却比较缓慢。如何利用便携式计算设备的硬件,实现快速、实时、准确的进行文本扫读依然是个难点,而当前面向便携式计算设备的文本识别方法绝大多数只能应用在比较简单的场景且需要较复杂的人工操作。0CR(0ptiCalCharacterRecognition)能对图片中的文本进行识别,TTS(Text To Speech)则能将文本转化为语音,在桌面计算设备上,OCR和TTS是非常常见的信息获取和传递手段。随着计算机和通信技术的快速发展,便携式计算设备得到了飞速发展,为人们获取和传递信息提供了新的途径,目前已有大量在便携式计算设备上进行OCR和TTS的方法。扫读指通过便携式计算设备上集成的摄像头获取包含文本的图片,然后通过OCR获取图片中的文本,并将文本通过TTS转成语音反馈给用户,可帮助某些特殊用户(如盲人和视弱人群)感知周围环境。但当前出现的一些面向便携式计算设备的文本识别设备/软件仅仅面对比较简单的场景且需要较复杂的人工操本文档来自技高网...

【技术保护点】
一种面向便携式计算设备的快速文本扫读方法,其特征在于其实施步骤如下:1)图像预处理:通过面向便携式计算设备的摄像头捕获包含文本的图片,然后将捕获的图片依次通过旋转矫正、检测提取文本区域,得到以行为单位的文本区域数据集;2)文本识别及语音输出:调用OCR引擎对以行为单位的文本区域数据集进行文本识别;同时对OCR识别速度进行预估,根据预估结果调节TTS播报速率;在进行文本识别的同时,将识别出来的以行为单位的文字信息和所述TTS播报速率发给TTS引擎以声音的形式反馈给用户。

【技术特征摘要】
2012.10.31 CN 201210427515.01.一种面向便携式计算设备的快速文本扫读方法,其特征在于其实施步骤如下: 1)图像预处理:通过面向便携式计算设备的摄像头捕获包含文本的图片,然后将捕获的图片依次通过旋转矫正、检测提取文本区域,得到以行为单位的文本区域数据集; 2)文本识别及语音输出:调用OCR引擎对以行为单位的文本区域数据集进行文本识别;同时对OCR识别速度进行预估,根据预估结果调节TTS播报速率;在进行文本识别的同时,将识别出来的以行为单位的文字信息和所述TTS播报速率发给TTS引擎以声音的形式反馈给用户。2.根据权利要求1所述的面向便携式计算设备的快速文本扫读方法,其特征在于,所述旋转矫正的详细步骤如下: Al.1)采用CANNY边缘检测算法和霍夫变化算法提取图像中最显著的直线信息; Al.2)通过直线信息判断图像的主方向; Al.3)然后根据所述图像的主方向旋转图像达到水平方向。3.根据权利要求1所述的面向便携式计算设备的快速文本扫读方法,其特征在于,所述检测提取文本区域的详细步骤如下: B1.1)输入旋转校正后的图片; B1.2)提取图像中灰度变化明显的局部区域; B1.3)将图像采用全局二值化算法进行处理得到二值化图像,将二值化图像进行闭运算处理; B1.4)采用Suzuki轮廓提取算法对整幅二值化图像进行矩形轮廓提取,得到所有局部区域的外部矩形轮廓集; B1.5)对所述外部矩形轮廓集进行过滤,过滤掉所有不满足文字矩形轮廓条件的外部矩形轮廓,保留最有可能是文字的外部矩形轮廓,作为文本子区域进行输出; B1.6)对文本子区域进行分割或合并操作,最终构建得到以行为单位的文本区域数据集。4.根据权利要求3所述的面向便携式计算设备的快速文本扫读方法,其特征在于,所述1.2B)的详细步骤如下: B1.2.1)对图片分别进行先开运算后闭运算和先闭运算后开运算,得到图像中稳定的矩形区域;所述开运算就是先腐蚀再膨胀,用于去掉目标外的孤立点,闭运算是先膨胀再腐蚀,用于去掉目标内的孔; B1.2.2)针对先开运算后闭运算和先闭运算后开运算得到的图像,分别采用图像灰度梯度计算方法获取图像中灰度变化明显的局部区域; B1.2.3)针对先开运算后闭运算和先闭运算后开运算得到的变化明显的局部区域进行线性合并,最终得到图像中灰度变化明显的局部区域。5.根据权利要求4所述的面向便携式计算设备的快速文本扫读方法,其特征在于,所述步骤B1.2.2)中采用的图像灰度梯度计算方法的函数表达式如式(I)所示; D=-Jif {x,y)-f{x + \,y)f + (/(χ,)’) — f(x, j + 1))2(I) 式⑴中,f(x,y)代表图像在坐标(χ,y)处的灰度值山表示所求的图像在坐标(χ,y)处的梯度值。6.根据权利要求5所述的面向便携式计算设备的快速文本扫读方法,其特征在于,所述步骤1.3B)的详细步骤如下: B1.3.1)将图像的图像数据根据式...

【专利技术属性】
技术研发人员:陈岭闯跃龙陈根才卜佳俊陈纯
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1