当前位置: 首页 > 专利查询>黄江山专利>正文

语言文字摘录器制造技术

技术编号:4101169 阅读:374 留言:0更新日期:2012-04-11 18:40
本实用新型专利技术公开了语言文字摘录器,其特征在于:包括用于采集动态连续图像的动态连续图像采样设备、用于处理动态连续图像的拼接处理模块(动态图像采样序列到全景图的映射,即图像序列的拼接)、图像中字符的鉴别及二值化模块、用于识别字符图片的OCR字符识别模块,所述动态连续图像采样设备、拼接处理模块、图像中字符的鉴别及二值化模块、字符识别OCR模块依次连接;本实用新型专利技术录入中文及多语种字符的产品成本大大降低,减少了使用者录入各类字符的劳动强度,极大降低使用者录入各类字符的经济成本,本实用新型专利技术成本低廉,可大量推广使用。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本技术涉及将印刷文字识别并转换成电子文档的
,尤其是一种中文 和其他文字的语言文字摘录器
技术介绍
随着人类对文字录入的便捷度需求,出现了越来越多的文字录入器,传统的有采 用静态图片拍摄,然后转入计算机进行图片处理和字符识别,得到纸件上的文字内容。现在最普遍使用的则是采用CIS(接触式图像传感器)技术的摘录器,这种摘录器 结构很复杂,而且目前普遍均是采用的进口设备,价格非常昂贵,不是所有的制造商能够承 受的。例如公开日为2008年10月15日,公告号为CN201134852的中国专利文献,公开了扫 描数位板,属于计算机外部设备输入领域。本装置具有数位板面板,数位板面板内固接有电 磁压力传感电路板和压感处理器,还包括由机械传动器、光学成像器和光电转换器顺次连 接组成的扫描器、功能转换开关和集线器,光电转换器和压感处理器的一端分别与集线器、 功能转换开关相连。本技术具备压感数位板操作的功能,还具有图文扫描输入功能,能 进行较大尺寸的文字、图像识别功能。数位板操作和扫描输入两种功能的转换,简单快捷, 而且采用数位板操作和扫描输入两个系统分别与USB接口集线器连接,由USB集线器完成 向计算机的输入,减少了连接线,解决了现有技术体积大不便使用的问题。数位板操作和扫 描输入两个功能系统组合在一个产品上,大大节省操作空间。但是这种扫描板的技术采用的是点阵扫描方式,点阵扫描方式是通过电子束、无 线电波等的左右移动在屏幕上显示出画面或图形,得到相对静止的图片,价格较贵。
技术实现思路
本技术为解决上述技术问题,提供了一种中文和其他文字的语言文字摘录 器,不仅结构简单,而且摘录速度较快,生产成本和使用成本都较低。本技术的技术方案如下语言文字摘录器,其特征在于包括依次连接的动态连续图像采样设备、动态连续 图像的拼接处理模块(动态图像采样序列到全景图的映射,即图像序列的拼接)、动态图像 鉴别及二值化模块、字符识别模块,动态连续图像采样设备对印刷文字进行动态连续图像 采样,动态图像的拼接处理模块对采集到的动态连续图像进行图片拼接,动态图像鉴别及 二值化模块继续进行图像鉴别及二值化处理,然后通过字符识别模块对处理好的图片进行 字符识别,最后将识别出来的字符存储及显示。动态连续图像记录设备可以是CXD (电荷藕合器件)图像传感器或者CMOS (互补 金属氧化物半导体)图像传感器。CCD、CM0S图像传感器都是半导体器件,能够把光学影像 转化为数字数据。CCD的作用就像胶片一样,但它是把图像像素转换成数字信号。CCD上有许多排列 整齐的电容,能感应光线,并将影像转变成数字信号。经由外部电路的控制,每个小电容能将其所带的电荷转给它相邻的电容。动态连续图像记录设备也可以是CMOS图像传感器,中文学名为互补金属氧化物 半导体。CMOS主要是利用硅和锗这两种元素所做成的半导体,使其在CMOS上共存着带 N(带-电)和P(带+电)级的半导体,这两个互补效应所产生的电流即可被处理芯片记录 和解读成影像。CXD与CMOS这两种图像传感器,都是利用感光二极管(photodiode)进行光电转 换,将图像转换为数字数据,而其主要差异是数字数据传送的方式不同。CCD图像传感器中每一行中每一个象素的电荷数据都会依次传送到下一个象素 中,由最底端部分输出,再经由传感器边缘的放大器进行放大输出;而在CMOS传感器中,每 个象素都会邻接一个放大器及A/D转换电路,用类似内存电路的方式将数据输出。本技术的工作原理如下首先将带有字符的纸质或其他载体放好位置,然后将语言文字摘录器放置其上, 打开语言文字摘录器的电源,接着通过语言文字摘录器的动态连续图像采样设备对带有字 符的纸质或其他载体进行动态图像采样,采集到的字符动态图像自动被动态图像处理模块 进行拼接处理,所作的处理包括排列、去除重叠部分、去噪、二值化等等,然后得到逐张的 字符图片,在通过字符识别模块对每张图片进行字符识别,最后将识别出来的字符存储及 显不。本技术的有益效果如下本技术因为采用了动态连续图像记录设备室获取的动态图像,所以在速度上 有大大提高,而且不怕采集过程中出现抖动的想象,因为即使抖动,本技术仍然可以得 到清晰的动态连续图片,即每一帧所获得的字符信息远远大于传统手段,本技术还可 以减少使用者录入各类字符的劳动强度,极大降低使用者录入各类字符的经济成本,还可 以大大降低录入中文及多语种字符的产品成本,本技术成本低廉,可大量推广使用。附图说明图1为本技术的结构示意图具体实施方式如图1所示,语言文字摘录器,包括依次连接的动态连续图像采样设备1、动态连 续图像的拼接处理模块2、动态图像鉴别及二值化模块3和字符识别模块4,动态连续图像 采样设备1对印刷文字进行动态连续图像采样,动态图像的拼接处理模块2对采集到的 动态连续图像进行图片拼接、动态图像鉴别及二值化模块3继续进行图像鉴别及二值化处 理,然后通过OCR字符识别模块4对处理好的图片进行字符识别,最后将识别出来的字符存 储及显示。动态连续图像记录设备1可以是(XD(电荷藕合器件图像传感器)。CXD图像传感 器是一种半导体器件,能够把光学影像转化为数字信号。CCD上植入的微小光敏物质称作像 素(Pixel)。一块CXD上包含的像素数越多,其提供的画面分辨率也就越高。动态连续图像记录设备1也可以是CMOS图像传感器,中文学名为互补金属氧化 物半导体。CMOS主要是利用硅和锗这两种元素所做成的半导体,使其在CMOS上共存着带N(带-电)和P(带+电)级的半导体,这两个互补效应所产生的电流即可被处理芯片记录 和解读成影像。本文档来自技高网...

【技术保护点】

【技术特征摘要】
语言文字摘录器,其特征在于包括用于采集动态连续图像的动态连续图像采样设备(1)、用于处理动态连续图像的拼接处理模块(2)、图像中字符的鉴别及二值化模块(3)用于识别字符图片的OCR字符识别模块(4),所述动态连续图像采样设备(1)、拼接处理模块(2)、...

【专利技术属性】
技术研发人员:黄江山
申请(专利权)人:黄江山
类型:实用新型
国别省市:90

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1