一种盲文方自适应定位方法及系统技术方案

技术编号:18019259 阅读:92 留言:0更新日期:2018-05-23 05:21
本发明专利技术涉及一种盲文方自适应定位方法及系统,包括:获取盲文图像的盲文点位置信息;对盲文点位置信息进行纵坐标的聚类,以得到多条预选盲文方水平行线的位置;根据各预选盲文方水平行线的纵坐标,从上往下判断是否存在符合标准的水平行线,若存在,则从三条水平行线开始,根据统计得到的盲文方点距、行距等信息分别向上、向下拓展,且拓展的过程中生成以最新拓展的一组三条水平行线为基准,同时剔除位置错误的水平行线,直到达到盲文图像上下两端,得到包含多组以三条水平行线为一组的盲文方水平线;同理得到盲文方竖直线;以盲文方竖直线和盲文方竖直线的相交点,构成盲文方网格。

【技术实现步骤摘要】
一种盲文方自适应定位方法及系统
本专利技术涉及盲文识别领域,特别涉及一种盲文方自适应定位方法及系统。
技术介绍
视力残疾人士由于视觉障碍,无法像明眼人一样获取明文信息,主要通过触摸盲文点字符号来阅读盲文获取信息。目前流通的盲文图书数量还较少,无法满足盲人朋友的阅读需求。另一方面,盲文图书馆典藏了很多早期有价值的盲文图书和文献,这些图书由于缺乏盲文的数字化信息,导致再版的人工成本昂贵。而且,在特殊教育领域,盲生试卷的编制和阅卷,还是采用盲文老师手工翻译的方式,耗时费力,缺乏客观性。因此,针对纸质盲文图像的盲文点字自动检测和识别技术具有重要意义。盲文俗称“点字”或“凸字”,由法国人路易·布莱尔于1824年专利技术,是一种依靠触觉感知的文字。盲文图书的一页大概有1000到2000个盲文凸点。盲文的基本组成单位是盲方或者盲符,每个盲方有6个点位,分布在三行两列的矩阵上,根据相应的点位上是否有凸点来代表不同的盲方。盲方根据“国家盲文标准”,按照一定的方距和行距进行排列,组成盲文。为了节约纸张,盲文图书一般采用双面打印方式,即我们得到的盲文图像即含有当前页的凸点区域,又包含凹点区域。凸点和凹点区域会有一定的错位现象,但是在双面盲文的点字密集区域,凸点和凹点往往交错在一起,导致盲文点字的图像表观呈现多样性特点,凹凸点的外观形态也会发生极大的变化,这给双面盲文的盲方定位和盲文识别带来极大的困难和挑战。盲方定位是盲文识别的基础,目前还缺乏鲁棒的盲文方定位方法。
技术实现思路
为了解决上述问题,本专利技术提出了一种盲文点检测方法及系统。具体地说,本专利技术公开了一种盲文方自适应定位方法,其中包括:步骤1、利用采集设备获取纸版盲文的数字化图像;步骤2、对该数字化图像的盲文进行盲文点标注,获得盲文图像;步骤3、对该盲文图像内的盲文方进行定位,生成该盲文图像的盲文方网格;其中该步骤3包括:步骤31、获取该盲文图像的盲文点位置信息;步骤32、根据预先设置的阈值范围,对该盲文点位置信息进行纵坐标的聚类,将盲文点纵坐标在该阈值范围内的盲文点划分为同一类别,并计算各类别中盲文点的纵坐标均值,根据该纵坐标均值得到多条预选盲文方水平行线的位置;步骤33、根据各预选盲文方水平行线的纵坐标,从上往下判断是否存在符合标准的三条水平行线,其中该标准为相邻两条水平行线间距离符合统计信息中盲文方点距的范围,若存在,则从该三条水平行线开始,根据统计得到的盲文方点距、行距等信息分别向上、向下拓展,且拓展的过程中生成以最新拓展的一组三条水平行线为基准,同时剔除位置错误的水平行线,直到达到该盲文图像上下两端,得到包含多组以三条水平行线为一组的盲文方水平线;步骤34、对该盲文点位置信息进行横坐标的聚类,将盲文点横坐标在该阈值范围内的盲文点划分为同一类别,并计算各类别中盲文点的横坐标均值,根据该横坐标均值得到多条预选盲文方竖直列线的位置;步骤35、根据各预选盲文方竖直列线的横坐标,从左到右判断是否存在符合标准的两条竖直列线,其中该标准为相邻两条竖直列线间距离符合统计信息中盲文方点距的范围,若存在,则从该两条竖直列线开始,根据统计得到的盲文方点距、行距等信息分别向左、向右拓展,且拓展的过程中生成以最新拓展的一组两条竖直列线为基准,同时剔除位置错误的竖直列线,直到达到该盲文图像左右两端,得到包含多组以两条竖直列线为一组的盲文方竖直线;步骤36、以该盲文方竖直线和该盲文方竖直线的相交点,构成该盲文方网格。该盲文方自适应定位方法,其中步骤1中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。该盲文方自适应定位方法,其中该步骤31还包括:对该盲文图像进行倾斜校正处理,获取斜校正处理完成后盲文图像的该盲文点位置信息。该盲文方自适应定位方法,其中该步骤2具体为:以盲文方为单位对该数字化图像进行交互式盲文点标注,以获得该盲文图像。该盲文方自适应定位方法,其中该倾斜校正处理包括:在该盲文图像上放置或粘贴一个矩形框,其中该矩形框的水平线和竖直线与盲文方的行和列平行,通过校正该矩形框对该盲文图像的倾斜校正处理;或根据该盲文图像边缘上的盲文点,使用最小二乘法拟合直线对该盲文图像的倾斜校正处理;或检测该盲文图像的纸张边缘直线,根据该纸张边缘直线的倾斜角度对该盲文图像的倾斜校正处理。本专利技术还提出了一种盲文方自适应定位系统,其中包括:采集模块,用于通过采集设备获取纸版盲文的数字化图像;标注模块,用于对该数字化图像的盲文进行盲文点标注,获得盲文图像;定位模块,用于对该盲文图像内的盲文方进行定位,生成该盲文图像的盲文方网格;其中该定位模块包括:纵坐标聚类模块,用于获取该盲文图像的盲文点位置信息,根据预先设置的阈值范围,对该盲文点位置信息进行纵坐标的聚类,将盲文点纵坐标在该阈值范围内的盲文点划分为同一类别,并计算各类别中盲文点的纵坐标均值,根据该纵坐标均值得到多条预选盲文方水平行线的位置;水平行线生成模块,用于根据各预选盲文方水平行线的纵坐标,从上往下判断是否存在符合标准的三条水平行线,其中该标准为相邻两条水平行线间距离符合统计信息中盲文方点距的范围,若存在,则从该三条水平行线开始,根据统计得到的盲文方点距、行距等信息分别向上、向下拓展,且拓展的过程中生成以最新拓展的一组三条水平行线为基准,同时剔除位置错误的水平行线,直到达到该盲文图像上下两端,得到包含多组以三条水平行线为一组的盲文方水平线;横坐标聚类模块,用于对该盲文点位置信息进行横坐标的聚类,将盲文点横坐标在该阈值范围内的盲文点划分为同一类别,并计算各类别中盲文点的横坐标均值,根据该横坐标均值得到多条预选盲文方竖直列线的位置;竖直列线生成模块,用于根据各预选盲文方竖直列线的横坐标,从左到右判断是否存在符合标准的两条竖直列线,其中该标准为相邻两条竖直列线间距离符合统计信息中盲文方点距的范围,若存在,则从该两条竖直列线开始,根据统计得到的盲文方点距、行距等信息分别向左、向右拓展,且拓展的过程中生成以最新拓展的一组两条竖直列线为基准,同时剔除位置错误的竖直列线,直到达到该盲文图像左右两端,得到包含多组以两条竖直列线为一组的盲文方竖直线;盲文方网格构成模块,用于以该盲文方竖直线和该盲文方竖直线的相交点,构成该盲文方网格。该盲文方自适应定位系统,其中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。该盲文方自适应定位系统,其中该纵坐标聚类模块还包括:对该盲文图像进行倾斜校正处理,获取斜校正处理完成后盲文图像的该盲文点位置信息。该盲文方自适应定位系统,其中该标注模块具体包括:以盲文方为单位对该数字化图像进行交互式盲文点标注,以获得该盲文图像。该盲文方自适应定位方法,其中该倾斜校正处理包括:在该盲文图像上放置或粘贴一个矩形框,其中该矩形框的水平线和竖直线与盲文方的行和列平行,通过校正该矩形框对该盲文图像的倾斜校正处理;或根据该盲文图像边缘上的盲文点,使用最小二乘法拟合直线对该盲文图像的倾斜校正处理;或检测该盲文图像的纸张边缘直线,根据该纸张边缘直线的倾斜角度对该盲文图像的倾斜校正处理。附图说明图1为双面盲文图像截图;图2为以点的形式在屏幕上显示盲文方对应盲文点位置的示意图;图3为以“本文档来自技高网...
一种盲文方自适应定位方法及系统

【技术保护点】
一种盲文方自适应定位方法,其特征在于,包括:步骤1、利用采集设备获取纸版盲文的数字化图像;步骤2、对该数字化图像的盲文进行盲文点标注,获得盲文图像;步骤3、对该盲文图像内的盲文方进行定位,生成该盲文图像的盲文方网格;其中该步骤3包括:步骤31、获取该盲文图像的盲文点位置信息;步骤32、根据预先设置的阈值范围,对该盲文点位置信息进行纵坐标的聚类,将盲文点纵坐标在该阈值范围内的盲文点划分为同一类别,并计算各类别中盲文点的纵坐标均值,根据该纵坐标均值得到多条预选盲文方水平行线的位置;步骤33、根据各预选盲文方水平行线的纵坐标,从上往下判断是否存在符合标准的三条水平行线,其中该标准为相邻两条水平行线间距离符合统计信息中盲文方点距的范围,若存在,则从该三条水平行线开始,根据统计得到的盲文方点距、行距等信息分别向上、向下拓展,且拓展的过程中生成以最新拓展的一组三条水平行线为基准,同时剔除位置错误的水平行线,直到达到该盲文图像上下两端,得到包含多组以三条水平行线为一组的盲文方水平线;步骤34、对该盲文点位置信息进行横坐标的聚类,将盲文点横坐标在该阈值范围内的盲文点划分为同一类别,并计算各类别中盲文点的横坐标均值,根据该横坐标均值得到多条预选盲文方竖直列线的位置;步骤35、根据各预选盲文方竖直列线的横坐标,从左到右判断是否存在符合标准的两条竖直列线,其中该标准为相邻两条竖直列线间距离符合统计信息中盲文方点距的范围,若存在,则从该两条竖直列线开始,根据统计得到的盲文方点距、行距等信息分别向左、向右拓展,且拓展的过程中生成以最新拓展的一组两条竖直列线为基准,同时剔除位置错误的竖直列线,直到达到该盲文图像左右两端,得到包含多组以两条竖直列线为一组的盲文方竖直线;步骤36、以该盲文方竖直线和该盲文方竖直线的相交点,构成该盲文方网格。...

【技术特征摘要】
1.一种盲文方自适应定位方法,其特征在于,包括:步骤1、利用采集设备获取纸版盲文的数字化图像;步骤2、对该数字化图像的盲文进行盲文点标注,获得盲文图像;步骤3、对该盲文图像内的盲文方进行定位,生成该盲文图像的盲文方网格;其中该步骤3包括:步骤31、获取该盲文图像的盲文点位置信息;步骤32、根据预先设置的阈值范围,对该盲文点位置信息进行纵坐标的聚类,将盲文点纵坐标在该阈值范围内的盲文点划分为同一类别,并计算各类别中盲文点的纵坐标均值,根据该纵坐标均值得到多条预选盲文方水平行线的位置;步骤33、根据各预选盲文方水平行线的纵坐标,从上往下判断是否存在符合标准的三条水平行线,其中该标准为相邻两条水平行线间距离符合统计信息中盲文方点距的范围,若存在,则从该三条水平行线开始,根据统计得到的盲文方点距、行距等信息分别向上、向下拓展,且拓展的过程中生成以最新拓展的一组三条水平行线为基准,同时剔除位置错误的水平行线,直到达到该盲文图像上下两端,得到包含多组以三条水平行线为一组的盲文方水平线;步骤34、对该盲文点位置信息进行横坐标的聚类,将盲文点横坐标在该阈值范围内的盲文点划分为同一类别,并计算各类别中盲文点的横坐标均值,根据该横坐标均值得到多条预选盲文方竖直列线的位置;步骤35、根据各预选盲文方竖直列线的横坐标,从左到右判断是否存在符合标准的两条竖直列线,其中该标准为相邻两条竖直列线间距离符合统计信息中盲文方点距的范围,若存在,则从该两条竖直列线开始,根据统计得到的盲文方点距、行距等信息分别向左、向右拓展,且拓展的过程中生成以最新拓展的一组两条竖直列线为基准,同时剔除位置错误的竖直列线,直到达到该盲文图像左右两端,得到包含多组以两条竖直列线为一组的盲文方竖直线;步骤36、以该盲文方竖直线和该盲文方竖直线的相交点,构成该盲文方网格。2.如权利要求1所述的盲文方自适应定位方法,其特征在于,步骤1中该采集设备包括扫描仪、摄像机或盲文图像采集仪器;该纸版盲文包括凸点和/或凹点形式的盲文点。3.如权利要求1所述的盲文方自适应定位方法,其特征在于,该步骤31还包括:对该盲文图像进行倾斜校正处理,获取斜校正处理完成后盲文图像的该盲文点位置信息。4.如权利要求1所述的盲文方自适应定位方法,其特征在于,该步骤2具体为:以盲文方为单位对该数字化图像进行交互式盲文点标注,以获得该盲文图像。5.如权利要求3所述的盲文方自适应定位方法,其特征在于,该倾斜校正处理包括:在该盲文图像上放置或粘贴一个矩形框,其中该矩形框的水平线和竖直线与盲文方的行和列平行,通过校正该矩形框对该盲文图像的倾斜校正处理;或根据该盲文图像边缘上的盲文点,使用最小二乘法拟合直线对该盲文图像的倾斜校正处理;或检测该盲文图像的纸张边缘直线,根据该纸张边缘直线的倾斜角度对该盲文图像的倾斜校正处理。6.一种盲文方自适应定位系统,其特征...

【专利技术属性】
技术研发人员:刘宏黎仁强王向东钱跃良
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1