一种双目电子阅读器制造技术

技术编号:3974698 阅读:196 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了属于图像识别领域的一种双目电子阅读器。通过两个摄像头获取文档的不同角度的两幅图像,利用计算机视觉原理对图像进行处理,进而通过文字识别、语音合成和发声处理,最后转换成声音。本发明专利技术可以辅助保存珍贵资料以及实现电子文档化;也可以辅助盲人、弱视阅读者进行阅读;还可以帮助视力正常的人避免视觉疲劳、减缓眼睛近视。

【技术实现步骤摘要】

本专利技术涉及图像识别领域,尤其涉及一种双目电子阅读器
技术介绍
现有电子阅读器采用的是具有一个摄像头的图像采集设备。在阅读书本时,由于 书本的厚度造成书本表面不是平直的,而是弯曲的,所摄文字出现扭曲,用光学字符识别软 件识别时,会使识别率显著下降,进而影响阅读质量。
技术实现思路
本专利技术的目的是针对
技术介绍
中所描述的现有单摄像头电子阅读器存在的问题, 提出了 一种具有两个摄像头的双目电子阅读器。本专利技术的技术方案是一种双目电子阅读器,包括主机、载物台、支架、摄像头一和摄像头二 ;其中,所述 支架弯曲,其一端固定于载物台上,另一端伸向载物台上方;所述摄像头一和摄像头二连接 于支架伸向载物台上方的一端,摄像头一和摄像头二的间距可以调整;所述摄像头一及摄 像头二的镜头位于同一平面并向下正对载物台,镜头所在平面与载物台平行;所述摄像头 一及摄像头二与主机连接。本专利技术中所述主机包含控制模块、图像获取模块、图像处理模块、文字识别模块和 存储管理模块;所述控制模块分别与图像获取模块、存储管理模块相连;所述图像获取模 块还与图像处理模块相连;所述图像处理模块还与存储管理模块、文字识别模块相连;所 述文字识别模块还与存储管理模块相连。本专利技术所述主机还可包含语音合成模块和发音模块;所述语音合成模块分别与文 字识别模块、发音模块相连;所述发音模块还与控制模块相连。本专利技术所述支架可以弯曲成直角,其一端竖直固定于载物台的一侧,另一端水平 位于载物台上方。本专利技术所述摄像头一及摄像头二的两镜头之间的间距为镜头与载物台之间距离 的0.8 1.6倍。本专利技术还可包括灯罩和辅助光源,所述灯罩附着于支架伸向载物台上方的一端; 所述辅助光源固定在灯罩内部。本专利技术的有益效果是1、由于采用两个摄像头采集图像,并应用图像处理技术,将弯曲的图像处理成拉平的图像,通过光学字符识别软件进行识别,可以得到比较高的字符识别率,提高阅读质 量,从而有利于更好地辅助保存珍贵资料以及实现电子文档化。2、由于本专利技术中运用了语音合成模块和发音模块,可将识别后的文本文件转换成语音文件输出,从而可以辅助盲人、弱视阅读者进行阅读。对于视力正常的人,使用本专利技术 进行阅读,还可避免视觉疲劳,缓减眼睛近视。附图说明图1为本专利技术的实施例结构示意图;图2为本专利技术实施例的使用演示图;图3为本专利技术主机内部模块连接关系示意图。具体实施例方式下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性 的,而不是为了限制本专利技术的范围及其应用。如图1所示,是本专利技术的一个实施例。包括主机1、载物台2、支架3、摄像头一 5和 摄像头二 6 ;支架3弯曲,一端固定于载物台2上,另一端伸向载物台2上方;摄像头一 5及 摄像头二 6连接于支架3伸向载物台上方的一端,二者之间的间距可以调整;摄像头一 5及 摄像头二6的镜头位于同一平面并向下正对载物台,镜头所在平面与载物台2平行;摄像头 一 5及摄像头二 6与主机1连接;还包括灯罩4和辅助光源7,灯罩4附着于支架3伸向载 物台上方的一端;辅助光源7固定在灯罩4内部。其中,主机为计算机或嵌入式系统;主机 可与载物台一体,如图1、图2所示,也可与载物台分离。图1示出的双目电子阅读器中支架3弯曲成直角,其一端竖直固定于载物台2的 一侧,另一端水平位于载物台2上方。如图2所示,使用双目电子阅读器时,把拍摄对象8,如书本、报纸、杂志等,打开平 放于载物台上,在光线不足的情况下,使用者可以打开辅助光源7。摄像头一 5和摄像头二 6分别与支架3活动连接,可以沿支架3移动。调整摄像头一 5和摄像头二 6的间距,使该 间距为镜头与载物台2之间距离的0. 8 1. 6倍。其中,当间距为镜头与载物台2上拍摄 对象8之间距离的1. 2 1. 4倍时效果佳,尤其是1. 3倍时效果为最佳。开启主机,用摄像 头一 5和摄像头二 6对拍摄对象8进行拍照,获得同一拍摄对象的两个不同视点的图像,随 后由主机进行处理。如图3所示,本专利技术中的主机1包含图像获取模块、图像处理模块、文字识别模块、 存储管理模块以及控制模块;其中,所述控制模块分别与图像获取模块、存储管理模块相 连;所述图像获取模块还与图像处理模块相连;所述图像处理模块还与存储管理模块、文 字识别模块相连;所述文字识别模块还与存储管理模块相连。当本专利技术用于辅助盲人、弱视阅读者进行阅读时,主机1中可增加语音合成模块 和发音模块;所述语音合成模块分别与文字识别模块、发音模块相连;所述发音模块还与 控制模块相连。这两个模块用于将处理后得到的文本文件转换成语音文件,并语音输出。这 样,盲人或弱视阅读者就可以阅读拍摄对象8中的内容了。该方案正常视力人也可使用,可 以避免视觉疲劳,缓减眼睛近视。本专利技术的工作原理如下主机1中的图像获取模块控制摄像头一 5和摄像头二 6对书本等拍摄对象进行拍 照,获得同一对象的两个不同视点的图像后,将该图像交付图像处理模块进行处理。图象处理模块利用计算机视觉原理对两幅图像进行处理,计算出弯曲书本表面的 立体模型,该模型为弯曲书本表面的三维模型,即计算出文档表面各个点的三维坐标平面坐标X、y以及深度坐标Z,其中X轴为载物台平面的横向方向,y轴为载物台平面的纵向方 向,ζ轴为垂直于载物台平面的方向。此处使用三次样条差值函数,设某点χ的深度为S (χ)S (χ) =S (Xi) = aiX^biX^CiX+di其中,ai; bi; Ci, Cli为模型参数。首先,在图像的χ方向上基本平均地选取n+1个笔画点交点,通过对两幅图像的图 像配准,然后,通过计算机视觉原理,计算出该n+1个点的深度S (χ),通过三次样条差值计 算方法,计算出χ方向上各点的深度。在进行拉伸变换时,对一幅图像上的每个点(χ,y),其横向坐标为χ,通过对每段 曲线S(X) =S(Xi) =3乂+1^2+(^+屯,进行曲线长度的积分计算,得到新的坐标值χ’。在 新的图像上,在(x’,y)位置上重绘原(x,y)点的像素值。这样,原来弯曲的图像被处理成 拉平的图像。处理后的图像被保存于存储管理模块,并被传送至文字识别模块。 文字识别模块通过光学字符识别软件进行识别,可以得到比较高的字符识别率。 识别后得到txt格式的文本被保存于存储管理模块,并被传送至语音合成模块。合成后的 语音文件通过发音模块对文档内容进行朗读。本专利技术中运用了计算机视觉原理中的双目立体视觉原理,及摄像机标定技术。摄 像机标定是为了确定摄像机的位置、属性参数和建立成像模型,以便确定空间坐标系中物 体点同它在图像平面上像点之间的对应关系。立体视觉的基本任务之一是从摄像机获取的 图像信息出发计算三维空间中物体的几何信息,并由此重建和识别物体,而空间物体表面 某点的三维几何位置,其与图像中对应点之间的相互关系是由摄像机成像的几何模型决定 的,这些几何模型参数就是摄像机参数。在大多数条件下这些参数必须通过实验才能得到, 这个过程被称为是摄像机标定。摄像机标定需要确定摄像机内部几何和光学特性(内部参 数)和相对一个世界坐标系的摄像机坐标系的三维位置和方向(外部参数)。在计算机视 觉中,常使用多个摄像机,对每个摄像机都要校准。以上所述,仅为本专利技术较佳的具体实施方式,但本专利技术的保护本文档来自技高网...

【技术保护点】
一种双目电子阅读器,其特征在于,包括主机(1)、载物台(2)、支架(3)、摄像头一(5)和摄像头二(6);所述支架(3)弯曲,一端固定于载物台(2)上,另一端伸向载物台(2)上方;所述摄像头一(5)和摄像头二(6)连接于支架(3)伸向载物台上方的一端,摄像头一(5)和摄像头二(6)的间距可以调整;所述摄像头一(5)及摄像头二(6)的镜头位于同一平面并向下正对载物台,镜头所在平面与载物台(2)平行;所述摄像头一(5)及摄像头二(6)与主机(1)连接。

【技术特征摘要】

【专利技术属性】
技术研发人员:童立靖付晓玲宋丽华肖珂
申请(专利权)人:北方工业大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利