【技术实现步骤摘要】
一种基于深度学习的端到端脱机手写英文识别方法及装置
本专利技术属于图像识别
,提出一种基于深度学习的端到端脱机手写英文识别方法及装置。
技术介绍
伴随着信息化时代的到来,一场无声的战争已然打响,技术呈现爆发式增长,各类新产品相继诞生。其中,自动识别产品逐渐走进了人们的视野,人们在享受科技带来便利的同时,更加追求技术的超越,这不仅推动了文字识别领域新兴技术的兴起,更使产品具有其独特的竞争力。在传统文字识别
,脱机手写识别一直是研究的重点和难点。近年来,随着人工智能技术的迅猛发展,在文本识别方面的相关新兴技术层出不穷,现从技术层面大致分为两类:手写单字识别技术和手写字符串识别技术。其中脱机手写英文识别属于手写字符串识别的技术范畴,传统字符串识别方法都是采用字符切割的方式做单字识别处理,再将识别出的单字符结果做合并处理。考虑到真实手写英文字符存在各种差异,如:字符黏连,字符大小不一,字符形态多变等特点,实际切割面临诸多困难,而人工智能技术突破了传统技术的束缚,引入了全新的字符串整体识别技术,并逐渐走向成熟。为了 ...
【技术保护点】
1.一种基于深度学习的端到端脱机手写英文识别方法,其特征在于,所述方法在CNN和RNN网络中的字符图像处理环节引入单字符的定位,并在单字符定位之后,CNN网络之间加入空间转换网络STN作为字符的矫正方法,最后在特征输出层再接入字符解码模型。/n
【技术特征摘要】
1.一种基于深度学习的端到端脱机手写英文识别方法,其特征在于,所述方法在CNN和RNN网络中的字符图像处理环节引入单字符的定位,并在单字符定位之后,CNN网络之间加入空间转换网络STN作为字符的矫正方法,最后在特征输出层再接入字符解码模型。
2.根据权利要求1所述的一种基于端到端的脱机手写英文识别方法,其特征在于,所述方法具体包括以下步骤:
步骤一,采用连通域定位方法将存在间隔的独立字符进行定位,得到单个或连体的字符片段作为识别的对象;
步骤二,通过将空间转换网络STN引入CNN网络中,完成图像特征的变换,输出矫正后的特征图;
步骤三,在每层的CNN网络中都嵌入STN,提取字符特征信息;
步骤四,将提取的特征序列依次按序送入至RNN网络中,RNN网络采用改进的LSTM网络,对输入的特征序列信息做上下文的关联,利用遗忘门控单元做信息取舍,将重要的状态记录,并多次学习有用的信息做正向和反向的推理,输出具有预测性的特征序列;
步骤五,采用EnCTC算法对步骤四中所述特征序列进行字符的解码,EnCTC损失函数可准确的翻译出每个被定位的字符,再将这些转译后的字符选择出最佳的字符路径,依次输出最终识别的每个字符。
3.根据权利要求2所述的一种基于端到端的脱机手写英文识别方法,其特征在于,步骤二中,所述STN网络包括:定位网络、网格生成器和采样器,定位网络做形变参数估计,所述网格生成器和采样器将根据估计的参数产生新的形变特征图。
4.根据权利要求3所述的一种基于端到端的脱机手写英文识别方法,其特征在于,所述形变参数估计包括旋转度、平移距离和缩放因子。
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。