一种基于深度学习的手写盲文识别方法及系统技术方案

技术编号：35182159 阅读：23 留言：0更新日期：2022-10-12 17:51

本发明专利技术提出一种基于深度学习的手写盲文识别方法和系统，包括采用已标注盲符区域的盲文图像训练语义分割模型进行像素级分割，得到预训练模型；获取训练用手写盲文图像和待识别手写盲文图像，并将训练用手写盲文图像输入预训练模型，得到初步盲符识别结果并进行标注，基于标注数据对预训练模型进行迁移学习，得到新模型；待识别手写盲文图像通过新模型进行识别，对识别结果进行盲方识别，得到方框级的盲符识别结果，将盲符识别结果通过盲文电子化操作转化为电子盲文；根据通用盲文规则，将电子盲文映射为拼音与标点符号，并利用通用盲文的标调规则和简写规则对拼音进行标调，得到待识别手写盲文图像的手写盲文识别结果和转拼音结果。结果。结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的手写盲文识别方法及系统

[0001]本专利技术涉及盲文图像自动识别
，并特别涉及一种基于深度学习的手写盲文识别方法及系统。

技术介绍

[0002]盲文又称为盲字、凸字或点字，是一种供盲人使用的特定文字，由六个点按一定凹凸起伏的规律排列组合而成，靠触觉感知。盲文在盲人的日常生活中占据着重要地位，是他们获取知识、与他人交流不可缺少的工具。每个盲符由0
‑
6个凸点/凹点构成，六点形如一个三行两列的矩阵，盲符中六点的编号为第一列从上到下1、2、3，第二列从上到下4、5、6。盲符结构如附图1所示，每个盲符由0～6个凸点组成，每个盲点可凸出、可不凸出，构成64(26)种盲符(包括空盲符)。
[0003]在特殊教育学校教授盲人教育的老师，除专业教授盲文认读的老师外，多数不懂盲文，如何让不懂盲文的人看懂盲文成为迫切需要解决的技术问题。例如老师批阅盲生的作业和试卷过程十分繁琐耗时，需由专业人士将盲文翻译成拼音或者中文，老师再进行评阅。将手写的纸版盲文扫描为盲文图像，利用计算机算法自动识别盲符、将其转化为电子盲文，并进行盲文到拼音以及汉语或英语等的转化在盲生教育领域具有迫切的现实需求和社会意义。
[0004]目前常用的盲符识别方法主要包括基于传统数字图像处理的方法和基于机器学习的识别方法。图像处理方法主要利用图像灰度阈值或盲点边缘检测等技巧将盲点与背景分离，然后构建盲文网格将盲点转换为识别的盲符。机器学习方法则通过图像特征进行分类学习，来识别盲符。
[0005]现有技术的...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的手写盲文识别方法，其特征在于，包括：步骤1、采用已标注盲符区域的标准盲文图像训练语义分割模型进行64类盲符的像素级分割，训练得到预训练模型；步骤2、获取训练用手写盲文图像和待识别手写盲文图像，并将该训练用手写盲文图像输入该预训练模型，得到初步盲符识别结果，经过对该初步盲符识别结果进行校对和标注，得到标注数据，基于该标注数据对该预训练模型进行迁移学习，得到新模型；步骤3、该待识别手写盲文图像通过该新模型进行识别，对识别结果进行盲方识别，得到方框级的盲符识别结果，将该盲符识别结果通过盲文电子化操作转化为电子盲文；步骤4、根据通用盲文规则，将该电子盲文映射为拼音与标点符号，并利用通用盲文的标调规则和简写规则对拼音进行标调，得到该待识别手写盲文图像的手写盲文识别结果和转拼音结果。2.如权利要求1所述的基于深度学习的手写盲文识别方法，其特征在于，该步骤4包括：根据该标调规则和该简写规则标记出该电子盲文中符合盲文规则的盲文和不符合盲文规则的盲文，将符合盲文规则的盲文和盲文原有的声调采用同一种颜色或字体进行展示，将根据通用盲文的省写规则后加声调用另外一种颜色或字体进行表示，不符合盲文规则的盲文用第三种颜色或字体进行显示。3.如权利要求1所述的基于深度学习的手写盲文识别方法，其特征在于，该训练用手写盲文图像和该待识别手写盲文图像具有用于标识盲符方向的符号，通过识别检测该符号，统一每张该训练用手写盲文图像和该待识别手写盲文图像的标识盲符方向，得到方向统一的训练用手写盲文图像和方向统一的待识别手写盲文图像；根据所有训练数据和用于迁移学习的手写盲文图像统计颜色分布，对方向统一的待识别手写盲文图像的颜色进行归一化处理，处理后的图像输入该新模型。4.如权利要求1所述的基于深度学习的手写盲文识别方法，其特征在于，该步骤1包括将标准盲文图像裁剪为多个大小一致的区域来进行训练，同时对应的盲符区域也进行相应的裁剪，在训练阶段采用交叉熵损失和Dice损失不断更新网络参数，直到交叉熵损失和Dice损失均收敛，得到该预训练模型。5.如权利要求1所述的基于深度学习的手写盲文识别方法，其特征在于，该步骤2包括：经过人工校对和标注，得到该初步盲符识别的盲符标注图，并将该盲符标注图极其对应的该训练用手写盲文图像输入该预训练模型进行迁移学习，得到优化后的该新模型。6.一种基于深度学习的手写盲文识别系统，...

【专利技术属性】
技术研发人员：刘宏，雷欣，王向东，钱跃良，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人