【技术实现步骤摘要】
基于目标检测的二阶段盲文检测识别方法
[0001]本专利技术涉及计算机视觉领域,具体涉及一种基于目标检测的二阶段盲文检测识别方法。
技术介绍
[0002]盲文是盲人使用的书面文字,每个盲文字符由3行2列的凸点和非凸点构成。对盲文的自动化机器翻译不仅有助于正常人和盲人的书面交流,更能减轻盲校教师批改盲人学生作业和试卷的压力。准确的盲文检测和识别是整个盲文机器翻译工作的基础和关键。
[0003]目前的盲文检测识别方法主要分两类,传统方法和深度学习方法。传统方法无需训练数据,直接根据规则对盲文进行检测识别,但是准确率较低,泛化性较差。深度学习方法准确率较高,但是需要标注大量训练数据。而对盲文字符的标注十分困难并且成本极大。本专利技术针对上述问题提出一种新的盲文检测识别解决方案。
技术实现思路
[0004]本专利技术要克服现有技术的上述缺点,提供一种基于目标检测的二阶段盲文检测识别方法。
[0005]为了解决上述技术问题,本专利技术提出一种基于目标检测的二阶段盲文检测识别方法,包括:
[000 ...
【技术保护点】
【技术特征摘要】
1.一种基于目标检测的二阶段盲文检测识别方法,其特征在于,包括如下步骤:S110,使用盲文行检测模型得到纸质盲文扫描图片中的所有盲文行坐标;S120,根据盲文行坐标,将图片中的所有盲文行按照从上到下的顺序裁剪下来,依次送入盲文单字检测模型;S130,使用盲文单字检测模型得到每个盲文行图片中所有盲文字符的坐标和类别;S140,根据盲文行检测坐标和单字检测坐标还原整张图片的盲文检测识别结果。2.如权利要求1所述的基于目标检测的二阶段盲文检测识别方法,其特征在于,步骤S110包括:S1101将盲文行作为检测目标,完成盲文图片数据的盲文行位置框坐标标注;S1102使用目标检测算法CenterNet训练一个盲文行检测模型;S1103使用盲文行检测模型检测得到盲文图片上n个盲文行的左上右下坐标集合3.如权利要求1所述的基于目标检测的二阶段盲文检测识别方法,其特征在于,步骤S120,包括:S1201对检测...
【专利技术属性】
技术研发人员:卜佳俊,谷雨,于智,李亮城,邢航笛,邵子睿,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。