【技术实现步骤摘要】
基于原型网络的手写汉字识别方法、装置、设备及介质
[0001]本专利技术涉及手写汉字识别
,具体涉及一种基于原型网络的手写汉字识别方法、装置、设备及介质。
技术介绍
[0002]随着智能化时代的到来,枯燥重复的程序化工作必然逐渐被无需人工或者少量人工的智能化技术所代替,文字识别技术将不可避免的得到广泛应用,而如今文字识别融合了机器视觉,机器翻译等多种学科,其技术水平随着图像识别技术和计算机技术的发展而水涨船高,但就我国目前的文字识别产品来说,其识别速度和识别精度依然无法满足用户的实际需求。国外在文字识别方面起步稍早,对于英文单词的识别精度也能够达到99%,但对于中文的识别却远远达不到这么高的精度。除去技术起步时间较晚外,中文汉字繁多的种类、复杂的结构和繁多的笔画也是造成汉字识别精度较低的原因,在此基础上,对于脱机手写体汉字文书的识别只会更加困难,具体表现在:(1)手写字符往往和标准字体有所差距,有时甚至相差甚远,带有严重的“个人风格”。
[0003](2)手写文书的格式也并不标准,偏旁部首之间的距离,汉字与汉字 ...
【技术保护点】
【技术特征摘要】
1.基于原型网络的手写汉字识别方法,其特征在于,包括:获取手写文书的灰度图像;基于所述灰度图像进行汉字字符的分割,得到手写文书内每一汉字字符的图像数据;将每一所述汉字字符的图像数据作为预先训练的原型网络汉字识别模型的输入,获取原型网络汉字识别模型的输出,所述输出为相对于输入的汉字字符的候选字符集;基于最大后验概率准则,扩充每一所述候选字符集,得到手写文书内每一汉字字符的扩充候选字符集,并将所述扩充候选字符集与候选字符集取并集形成新候选字符集;将所述新候选字符集作为预先训练的bi
‑
gram语言模型的输入,结合Viterbi算法选择具有最大概率的句子路径,形成手写文书的识别文本。2.根据权利要求1所述基于原型网络的手写汉字识别方法,其特征在于,所述原型网络汉字识别模型的训练包括:获取嵌入函数;根据所述嵌入函数对输入空间进行处理,得到嵌入空间;以数据集各类中所有输入样本的均值作为各类的一个“原型”,在嵌入空间中计算输入样本到各类的“原型”的欧式距离;根据Softmax模型将输入样本归类到距离最短的“原型”所属的类别中;以交叉熵作为损失函数,利用Adam优化器不断最小化损失函数来优化嵌入函数参数,最终输出根据各个候选字符的概率大小排序的输入样本的候选字符集。3.根据权利要求2所述基于原型网络的手写汉字识别方法,其特征在于,获取嵌入函数的步骤包括:构建卷积神经网络,所述卷积神经网络由四个卷积模块构成,每一个卷积模块均包括64个3
×
3的卷积核的卷积层、批量归一化层、ReLU非线性层和一个2
×
2池化核大小的最大池化层;将原始样本作为所述卷积神经网络的输入,获得降维后的样本作为所述卷积神经网络的输出。4.根据权利要求2所述基于原型网络的手写汉字识别方法,其特征在于,基于最大后验概率准则,由每一输入样本的所述候选字符集来预测最有可能输入正确的汉字字符,并将这些最有可能输入正确的汉字字符按照概率大小...
【专利技术属性】
技术研发人员:俞翔,肖剑波,谢海燕,张乔斌,闫伟冬,楼京俊,胡世峰,刘杰峰,
申请(专利权)人:中国人民解放军海军工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。