The invention relates to a high precision Braille recognition method and system, including: using the acquisition equipment to obtain the digital image of the paper Braille, marking the Braille of the digital image, and taking the digitized image as the training sample, in which the Braille point is the convex point or the concave point; according to the Braille in the training sample, the braille is the Braille. The digital image is divided into positive samples containing Braille points and negative samples containing the background points, and multiple features are extracted from the positive and negative samples, and the multiple classifiers are trained respectively, and the Braille side of the Braille image detection will be located with the 6 Braille points as the center of the Braille. In the area to be detected, the various features of the detected region are input to the corresponding classifier, and the location and type information of the Braille in the Braille image to be detected is determined by the fusion of the recognition results of each classifier. Thus, the high accuracy recognition of Braille can be achieved by integrating the detection results of multiple classifiers.
【技术实现步骤摘要】
一种高精度盲文识别方法及系统
本专利技术涉及盲文标注领域,特别涉及一种高精度盲文识别方法及系统。
技术介绍
视力残疾人士由于视觉障碍,无法像明眼人一样获取明文信息,主要通过触摸盲文点字符号来阅读盲文获取信息。目前流通的盲文图书数量还较少,无法满足盲人朋友的阅读需求。另一方面,盲文图书馆典藏了很多早期有价值的盲文图书和文献,这些图书由于缺乏盲文的数字化信息,导致再版的人工成本昂贵。而且,在特殊教育领域,盲生试卷的编制和阅卷,还是采用盲文老师手工翻译的方式,耗时费力,缺乏客观性。因此,针对纸质盲文图像的盲文点字自动检测和识别技术具有重要意义。盲文俗称“点字”或“凸字”,由法国人路易·布莱尔于1824年专利技术,是一种依靠触觉感知的文字。盲文图书的一页大概有1000到2000个盲文凸点。盲文的基本组成单位是盲方或者盲符,每个盲方有6个点位,分布在三行两列的矩阵上,根据相应的点位上是否有凸点来代表不同的盲方。盲方根据“国家盲文标准”,按照一定的方距和行距进行排列,组成盲文。为了节约纸张,盲文图书一般采用双面打印方式,即我们得到的盲文图像即含有当前页的凸点区域,又包含凹点区域。凸点和凹点区域会有一定的错位现象,但是在双面盲文的点字密集区域,凸点和凹点往往交错在一起,导致盲文点字的图像表观呈现多样性特点,凹凸点的外观形态也会发生极大的变化,这给双面盲文的盲文识别带来极大的困难和挑战,目前还缺乏快速鲁棒的盲文识别方法。
技术实现思路
为了解决上述纸版盲文点检测技术不够鲁棒,速度较慢,无法适应多样的盲文打印形式和采集形式的问题,本专利技术提出了一种盲文点检测方法及系统。具体地 ...
【技术保护点】
一种高精度盲文识别方法,其特征在于,包括:步骤1、利用采集设备获取纸版盲文的数字化图像;步骤2、对该数字化图像的盲文进行盲文点标注,并将标注完成的数字化图像作为训练样本,其中该盲文点为凸点或凹点;步骤3、根据该训练样本训练多个分类器,并用训练完成的分类器对待检测盲文图像内的盲文点进行识别,将检测到的各盲文点的位置和类型信息保存并输出;其中该步骤3包括:步骤31、根据该训练样本中盲文点的标注信息,将该数字化图像划分为包含盲文点的正样本和包含背景点的负样本;步骤32、提取该正样本和该负样本的多种特征,分别训练多个分类器;步骤33、对该待检测盲文图像的盲文方进行定位,将以各盲文方对应的6个盲文点为中心的区域作为待检测区域,将该待检测区域的多种特征分别输入至相应分类器;步骤34、通过融合各分类器的识别结果,确定该待检测盲文图像内盲文点的位置和类型信息。
【技术特征摘要】
1.一种高精度盲文识别方法,其特征在于,包括:步骤1、利用采集设备获取纸版盲文的数字化图像;步骤2、对该数字化图像的盲文进行盲文点标注,并将标注完成的数字化图像作为训练样本,其中该盲文点为凸点或凹点;步骤3、根据该训练样本训练多个分类器,并用训练完成的分类器对待检测盲文图像内的盲文点进行识别,将检测到的各盲文点的位置和类型信息保存并输出;其中该步骤3包括:步骤31、根据该训练样本中盲文点的标注信息,将该数字化图像划分为包含盲文点的正样本和包含背景点的负样本;步骤32、提取该正样本和该负样本的多种特征,分别训练多个分类器;步骤33、对该待检测盲文图像的盲文方进行定位,将以各盲文方对应的6个盲文点为中心的区域作为待检测区域,将该待检测区域的多种特征分别输入至相应分类器;步骤34、通过融合各分类器的识别结果,确定该待检测盲文图像内盲文点的位置和类型信息。2.如权利要求1所述的高精度盲文识别方法,其特征在于,该步骤32具体包括:根据该正样本和该负样本的灰度特征、梯度直方图特征、局部二值特征,分别训练多个支持向量机分类器或随机森林分类器。3.如权利要求1所述的高精度盲文识别方法,其特征在于,该步骤34还包括:将该待检测盲文图像内盲文点的位置信息转化为盲文方信息。4.如权利要求3所述的高精度盲文识别方法,其特征在于,该步骤34还包括:将该盲文方信息转化为汉字和句子,根据句子排查检测错误的盲文方信息。5.如权利要求1所述的高精度盲文识别方法,其特征在于,步骤1中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。...
【专利技术属性】
技术研发人员:刘宏,黎仁强,王向东,钱跃良,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。