一种文字识别训练系统及方法技术方案

技术编号：21116539 阅读：31 留言：0更新日期：2019-05-16 09:13

本发明专利技术涉及一种文字识别训练系统及方法，属于文字识别技术；现有技术中，在训练神经网络过程中仅仅使用序列损失函数，但是中文文字繁多，其有众多字形相似，该损失函数效果不好，本发明专利技术提供了一种文字识别系统及方法，其损失函数采用序列损失函数与分类损失函数，有效的解决了中文文字识别过程中的分类错误。

全部详细技术资料下载

【技术实现步骤摘要】
一种文字识别训练系统及方法
本专利技术涉及一种文字识别技术，特别是涉及中文文字识别训练方法。
技术介绍
现今基于深度学习的文字识别训练结构大都如图1所示，首先由卷积神经网络等特征提取模型提取图片特征，之后使用循环神经网络或者自然语言处理等方法生成文字序列结果，采用序列模型的损失函数进行对齐和计算损失。训练过程中，通过序列损失函数间接调整特征提取模型，使之能提取出最具表达能力的特征。这在英文的文字识别模型中得到了很好的结果。但是中文的文字识别比英文文字识别在任务的复杂度上有明显的区别，首先是巨大的字符数量差异，英文只需识别26个字母，但是中文仅常用字库就有三四千的数目；并且，很多中文文字形状相似但意义大不相同，这也给准确识别带来了难度，例如对于像“莱”、“菜”这种形似的字符，容易产生混淆。观察发现，多数文字识别错误的原因是检错文字类别。特别是在自动驾驶、辅助驾驶领域，文字的正确识别是实现自动或辅助驾驶的重要环节。亟待需要一种用于自动驾驶、辅助驾驶的文字识别方法和系统。
技术实现思路
现有技术中对于文字的识别较少采用神经网络进行训练，更没有对已有神经网络进行优化。鉴于现有技术中存在的问题，本专利技术提供一种文字识别训练系统，其特征在于特征提取单元、文字识别单元和损失函数单元；所述特征提取单元对待识别文字的图片或图像进行特征提取；所述文字识别单元将输入的所述特征进行文字识别得到识别结果；所述系统还包括：通过待识别文字的图片或图像的预先标注，与所述识别结果进行对比，并构建损失函数，并存储于损失函数单元，由所述损失函数单元中的所述损失函数逐级反向传导，逐级修正所述文字识...

【技术保护点】
1.一种文字识别训练系统，其特征在于所述系统包括：特征提取单元、文字识别单元和损失函数单元；所述特征提取单元对待识别文字的图片或图像进行特征提取；所述文字识别单元将输入的所述特征进行文字识别得到识别结果；所述系统还包括：通过待识别文字的图片或图像的预先标注，与所述识别结果进行对比，并构建损失函数，并存储于损失函数单元，由所述损失函数单元中的所述损失函数逐级反向传导，逐级修正所述文字识别单元和所述特征提取单元；所述损失函数由两种不同类型的损失函数之和构成。

【技术特征摘要】
1.一种文字识别训练系统，其特征在于所述系统包括：特征提取单元、文字识别单元和损失函数单元；所述特征提取单元对待识别文字的图片或图像进行特征提取；所述文字识别单元将输入的所述特征进行文字识别得到识别结果；所述系统还包括：通过待识别文字的图片或图像的预先标注，与所述识别结果进行对比，并构建损失函数，并存储于损失函数单元，由所述损失函数单元中的所述损失函数逐级反向传导，逐级修正所述文字识别单元和所述特征提取单元；所述损失函数由两种不同类型的损失函数之和构成。2.根据权利要求1所述的系统，其特征在于：所述两种不同类型的损失函数分别为序列损失函数和分类损失函数。3.根据权利要求2所述的系统，其特征在于：所述分类损失函数表达字形相同的文字出现识别错误的概率。4.根据权利要求2所述的系统，其特征在于：所述系统的损失函数＝a*序列损失函数+b*分类损失函数，其中a、b为权重系数。5.根据权利要求1-4中任一项所述的系统，其特征在于：所述文字识别单元包括第一文字识别单元和第二文字识别单元，其分别对应列损失函数和...

【专利技术属性】
技术研发人员：胡杰，
申请(专利权)人：初速度苏州科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人