一种高精度盲文识别方法及系统技术方案

技术编号:17995170 阅读:134 留言:0更新日期:2018-05-19 12:18
本发明专利技术涉及一种高精度盲文识别方法及系统,包括:利用采集设备获取纸版盲文的数字化图像;对数字化图像的盲文进行盲文点标注,并将标注完成的数字化图像作为训练样本,其中盲文点为凸点或凹点;根据训练样本中盲文点的标注信息,将数字化图像划分为包含盲文点的正样本和包含背景点的负样本;提取正样本和负样本的多种特征,分别训练多个分类器;对待检测盲文图像的盲文方进行定位,将以各盲文方对应的6个盲文点为中心的区域作为待检测区域,将待检测区域的多种特征分别输入至相应分类器;通过融合各分类器的识别结果,确定待检测盲文图像内盲文点的位置和类型信息。由此通过融合多分类器的检测结果,实现对盲文的高精度识别。

A high precision Braille recognition method and system

The invention relates to a high precision Braille recognition method and system, including: using the acquisition equipment to obtain the digital image of the paper Braille, marking the Braille of the digital image, and taking the digitized image as the training sample, in which the Braille point is the convex point or the concave point; according to the Braille in the training sample, the braille is the Braille. The digital image is divided into positive samples containing Braille points and negative samples containing the background points, and multiple features are extracted from the positive and negative samples, and the multiple classifiers are trained respectively, and the Braille side of the Braille image detection will be located with the 6 Braille points as the center of the Braille. In the area to be detected, the various features of the detected region are input to the corresponding classifier, and the location and type information of the Braille in the Braille image to be detected is determined by the fusion of the recognition results of each classifier. Thus, the high accuracy recognition of Braille can be achieved by integrating the detection results of multiple classifiers.

【技术实现步骤摘要】
一种高精度盲文识别方法及系统
本专利技术涉及盲文标注领域,特别涉及一种高精度盲文识别方法及系统。
技术介绍
视力残疾人士由于视觉障碍,无法像明眼人一样获取明文信息,主要通过触摸盲文点字符号来阅读盲文获取信息。目前流通的盲文图书数量还较少,无法满足盲人朋友的阅读需求。另一方面,盲文图书馆典藏了很多早期有价值的盲文图书和文献,这些图书由于缺乏盲文的数字化信息,导致再版的人工成本昂贵。而且,在特殊教育领域,盲生试卷的编制和阅卷,还是采用盲文老师手工翻译的方式,耗时费力,缺乏客观性。因此,针对纸质盲文图像的盲文点字自动检测和识别技术具有重要意义。盲文俗称“点字”或“凸字”,由法国人路易·布莱尔于1824年专利技术,是一种依靠触觉感知的文字。盲文图书的一页大概有1000到2000个盲文凸点。盲文的基本组成单位是盲方或者盲符,每个盲方有6个点位,分布在三行两列的矩阵上,根据相应的点位上是否有凸点来代表不同的盲方。盲方根据“国家盲文标准”,按照一定的方距和行距进行排列,组成盲文。为了节约纸张,盲文图书一般采用双面打印方式,即我们得到的盲文图像即含有当前页的凸点区域,又包含凹点区域。凸点和凹点区域会有一定的错位现象,但是在双面盲文的点字密集区域,凸点和凹点往往交错在一起,导致盲文点字的图像表观呈现多样性特点,凹凸点的外观形态也会发生极大的变化,这给双面盲文的盲文识别带来极大的困难和挑战,目前还缺乏快速鲁棒的盲文识别方法。
技术实现思路
为了解决上述纸版盲文点检测技术不够鲁棒,速度较慢,无法适应多样的盲文打印形式和采集形式的问题,本专利技术提出了一种盲文点检测方法及系统。具体地说,本专利技术公开了一种高精度盲文识别方法,其中包括:步骤1、利用采集设备获取纸版盲文的数字化图像;步骤2、对该数字化图像的盲文进行盲文点标注,并将标注完成的数字化图像作为训练样本,其中该盲文点为凸点或凹点;步骤3、根据该训练样本训练多个分类器,并用训练完成的分类器对待检测盲文图像内的盲文点进行识别,将检测到的各盲文点的位置和类型信息保存并输出;其中该步骤3包括:步骤31、根据该训练样本中盲文点的标注信息,将该数字化图像划分为包含盲文点的正样本和包含背景点的负样本;步骤32、提取该正样本和该负样本的多种特征,分别训练多个分类器;步骤33、对该待检测盲文图像的盲文方进行定位,将以各盲文方对应的6个盲文点为中心的区域作为待检测区域,将该待检测区域的多种特征分别输入至相应分类器;步骤34、通过融合各分类器的识别结果,确定该待检测盲文图像内盲文点的位置和类型信息。该高精度盲文识别方法,其中该步骤32具体包括:根据该正样本和该负样本的灰度特征、梯度直方图特征、局部二值特征,分别训练多个支持向量机分类器或随机森林分类器。该高精度盲文识别方法,其中该步骤34还包括:将该待检测盲文图像内盲文点的位置信息转化为盲文方信息。该高精度盲文识别方法,其中该步骤34还包括:将该盲文方信息转化为汉字和句子,根据句子排查检测错误的盲文方信息。该高精度盲文识别方法,其中步骤1中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。本专利技术还公开了一种高精度盲文识别系统,其中包括:采集模块,用于通过采集设备获取纸版盲文的数字化图像;标注模块,用于对该数字化图像的盲文进行盲文点标注,并将标注完成的数字化图像作为训练样本,其中该盲文点为凸点或凹点;训练模块,用于根据该训练样本训练多个分类器,并用训练完成的分类器对待检测盲文图像内的盲文点进行识别,将检测到的各盲文点的位置和类型信息保存并输出;其中该训练模块包括:提取模块,用于根据该训练样本中盲文点的标注信息,将该数字化图像划分为包含盲文点的正样本和包含背景点的负样本,提取该正样本和该负样本的多种特征,分别训练多个分类器;识别模块,用于对该待检测盲文图像的盲文方进行定位,将以各盲文方对应的6个盲文点为中心的区域作为待检测区域,将该待检测区域的多种特征分别输入至相应分类器,并通过融合各分类器的识别结果,确定该待检测盲文图像内盲文点的位置和类型信息。该高精度盲文识别方系统,其中该提取模块包括:根据该正样本和该负样本的灰度特征、梯度直方图特征、局部二值特征,分别训练多个支持向量机分类器或随机森林分类器。该高精度盲文识别系统,其中该识别模块还包括:将该待检测盲文图像内盲文点的位置信息转化为盲文方信息。该高精度盲文识别系统,其中该识别模块还包括:将该盲文方信息转化为汉字和句子,根据句子排查检测错误的盲文方信息。该高精度盲文识别系统,其中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。由此通过融合多分类器的检测结果,实现对盲文的高精度识别。附图说明图1为双面盲文图像截图;图2为以点的形式在屏幕上显示盲文方对应盲文点位置的示意图;图3为以“日”字的交叉点形式在屏幕上显示盲文方对应盲文点位置的示意图;图4为已标注完成的盲文方示意图;图5为选择盲文方进行删除的示意图;图6为凸点和凹点的标注结果展示图;图7为基于级联分类器的凸点检测结果展示图;图8为盲文方定位结果示意图;图9为初始的计算机盲文点检测结果图;图10为本专利技术主要步骤框图。具体实施方式为让本专利技术的上述特征和效果能阐述的更明确易懂,下文特举实施例对上述各步骤进行展开描述,并配合说明书附图作详细说明如下。请参考图10,本专利技术包括,步骤1,盲文图像采集:利用采集设备获取纸版盲文的数字化图像。采集方式可以包括扫描仪扫描,摄像机拍照,或者特殊的盲文图像采集仪器等方式。该纸版盲文包括凸点和/或凹点形式的盲文点,纸版盲文可以包括盲文图书或者盲文试卷等,可以是单面印刷或者双面印刷的盲文。单面印刷的盲文每页只包含凸点或者凹点一种形式的盲文点,双面印刷的盲文每页包含凸点和凹点两种形式的盲文点。例如,图1显示了采用扫描仪扫描得到的双面盲文图像的截图,既有凸点又有凹点,在文字密集区,凸点和凹点交互在一起。步骤2,对该数字化图像的盲文进行盲文方标注,并将标注完成的数字化图像作为训练样本。步骤3,高精度盲文点和盲文方识别:通过以上步骤1到步骤2,得到盲文方的定位结果,可以利用盲文方位置信息,去除Adaboost级联分类器带来的部分误报,因为凸点基本上会出现在盲文方的六个盲文点位置,从而可以提升基于Adaboost分类器的识别效果。更重要的是在盲文方定位基础上,可以仅针对每个盲文方对应的6个盲文点区域,利用更复杂的分类器来提升凸点识别的准确性。本方面提出了一种基于盲文方定位和组合分类器的高精度盲文识别方法,具体步骤如下:步骤31,获取凸点或凹点标注信息,根据该训练样本中盲文点的标注信息,将该数字化图像划分为包含盲文点的正样本和包含背景点的负样本。需要注意的是,此处盲文点根据用户需要可为凸点或凹点,如指定凸点为盲文点,则认为该数字化图像中除凸点外的区域均为背景,例如截取以凸点为中心点的24*24图像作为正例样本,以凹点和背景的中心点的24*24图像作为反例样本。步骤32,提取样本的多种特征,分别训练多个分类器。优选的,可以提取灰度特征,可以提取HOG梯度直方图特征,可以提取LBP局部二值特征,或者将HOG和LBP进一步串联的特征,并采用支持向量机SVM或者随本文档来自技高网...
一种高精度盲文识别方法及系统

【技术保护点】
一种高精度盲文识别方法,其特征在于,包括:步骤1、利用采集设备获取纸版盲文的数字化图像;步骤2、对该数字化图像的盲文进行盲文点标注,并将标注完成的数字化图像作为训练样本,其中该盲文点为凸点或凹点;步骤3、根据该训练样本训练多个分类器,并用训练完成的分类器对待检测盲文图像内的盲文点进行识别,将检测到的各盲文点的位置和类型信息保存并输出;其中该步骤3包括:步骤31、根据该训练样本中盲文点的标注信息,将该数字化图像划分为包含盲文点的正样本和包含背景点的负样本;步骤32、提取该正样本和该负样本的多种特征,分别训练多个分类器;步骤33、对该待检测盲文图像的盲文方进行定位,将以各盲文方对应的6个盲文点为中心的区域作为待检测区域,将该待检测区域的多种特征分别输入至相应分类器;步骤34、通过融合各分类器的识别结果,确定该待检测盲文图像内盲文点的位置和类型信息。

【技术特征摘要】
1.一种高精度盲文识别方法,其特征在于,包括:步骤1、利用采集设备获取纸版盲文的数字化图像;步骤2、对该数字化图像的盲文进行盲文点标注,并将标注完成的数字化图像作为训练样本,其中该盲文点为凸点或凹点;步骤3、根据该训练样本训练多个分类器,并用训练完成的分类器对待检测盲文图像内的盲文点进行识别,将检测到的各盲文点的位置和类型信息保存并输出;其中该步骤3包括:步骤31、根据该训练样本中盲文点的标注信息,将该数字化图像划分为包含盲文点的正样本和包含背景点的负样本;步骤32、提取该正样本和该负样本的多种特征,分别训练多个分类器;步骤33、对该待检测盲文图像的盲文方进行定位,将以各盲文方对应的6个盲文点为中心的区域作为待检测区域,将该待检测区域的多种特征分别输入至相应分类器;步骤34、通过融合各分类器的识别结果,确定该待检测盲文图像内盲文点的位置和类型信息。2.如权利要求1所述的高精度盲文识别方法,其特征在于,该步骤32具体包括:根据该正样本和该负样本的灰度特征、梯度直方图特征、局部二值特征,分别训练多个支持向量机分类器或随机森林分类器。3.如权利要求1所述的高精度盲文识别方法,其特征在于,该步骤34还包括:将该待检测盲文图像内盲文点的位置信息转化为盲文方信息。4.如权利要求3所述的高精度盲文识别方法,其特征在于,该步骤34还包括:将该盲文方信息转化为汉字和句子,根据句子排查检测错误的盲文方信息。5.如权利要求1所述的高精度盲文识别方法,其特征在于,步骤1中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。...

【专利技术属性】
技术研发人员:刘宏黎仁强王向东钱跃良
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1