当前位置: 首页 > 专利查询>东南大学专利>正文

一种嵌入稀疏连接的深度卷积神经网络字符识别方法技术

技术编号:20797595 阅读:35 留言:0更新日期:2019-04-06 11:12
本发明专利技术公开了一种嵌入稀疏连接的深度卷积神经网络字符识别方法,属于信息与通信工程领域。本发明专利技术提供的字符识别方法,是基于深度卷积神经网络的,与现有方法不同的是,本发明专利技术是对深度卷积神经网络结构的改进,针对原有网络所存在的训练时内存溢出的问题,在原有的深度卷积神经网络中嵌入稀疏连接层,增加了网络的宽度,减少了参数,降低参数空间的维度。从而节省在网络训练和测试时所需要的硬件开销,减少了训练网络时所占用的内存空间,缩短了训练时所需要的时长。

A Character Recognition Method Based on Deep Convolution Neural Network Embedded with Sparse Connections

The invention discloses a deep convolution neural network character recognition method embedded with sparse connection, which belongs to the field of information and communication engineering. The character recognition method provided by the present invention is based on the deep convolution neural network. Unlike the existing methods, the present invention is an improvement of the structure of the deep convolution neural network. To solve the problem of memory overflow in the training of the original network, a sparse connection layer is embedded in the original deep convolution neural network, which increases the width of the network, reduces the parameters and reduces the parameters. The dimension of space. Thus, the hardware overhead needed in network training and testing is saved, the memory space occupied in training network is reduced, and the training time is shortened.

【技术实现步骤摘要】
一种嵌入稀疏连接的深度卷积神经网络字符识别方法
本专利技术涉及信息与通信工程
,特别是一种嵌入稀疏连接的深度卷积神经网络字符识别方法。
技术介绍
信息技术随着计算机的普及而飞速发展,图像作为信息技术中的重要传播载体,在信息传播中占着非常重要的地位,并融入我们的日常生活中。计算机的人工智能已经普遍应用于我们的生活中,使用计算机高效自动的处理能力帮助于各行各业已经成为减轻人员工作,加快工作效率的一种趋势。然而计算机并不能像人类一样通过视觉直接获取图像中所包含的信息,从而图像信息识别为文本信息这一过程对于计算机理解图像具有重要的意义。当前,图像识别已经应用于各种场景,如用于路上的车辆实时监控,获取车牌号信息,各种政府机关的证件照的识别与信息录入等,其辅助应用极大的提高了工作效率,同时还减少了错误率,极大程度上释放了人力资源,从而减少了人工成本。字符识别旨在从图片中检测和识别文字信息,即,对文本资料进行扫描,再对图像文件进行分析处理,获取文字及版面信息的过程。它主要应用于文档识别及证件识别。文档识别可以将印刷文档数字化以快速准确提取有效信息,证件识别则是将证件扫描或复印件数字化,从而提本文档来自技高网...

【技术保护点】
1.一种嵌入稀疏连接的深度卷积神经网络字符识别方法,其特征在于,包括以下步骤:步骤1、将训练集送入用于字符识别的嵌入稀疏连接的深度卷积神经网络检测模型中,对嵌入稀疏连接的深度卷积神经网络检测模型进行训练,训练完成后,保存所训练的嵌入稀疏连接的模型参数,用于字符识别;深度卷积神经网络检测模型的结构为:先对输入的训练集中的图片进行双通道并行处理,其中一条通道处理方式为:先通过卷积层提取特征,形成特征图,再通过池化层,对所提取的特征图进行压缩;另一通道的处理方式为:利用卷积核对输入的训练集中的图片进行降维;这两个通道的处理结果经过级联层相连接;随后,再通过依次连接的第一紧密连接模块、第一过渡模块、第...

【技术特征摘要】
1.一种嵌入稀疏连接的深度卷积神经网络字符识别方法,其特征在于,包括以下步骤:步骤1、将训练集送入用于字符识别的嵌入稀疏连接的深度卷积神经网络检测模型中,对嵌入稀疏连接的深度卷积神经网络检测模型进行训练,训练完成后,保存所训练的嵌入稀疏连接的模型参数,用于字符识别;深度卷积神经网络检测模型的结构为:先对输入的训练集中的图片进行双通道并行处理,其中一条通道处理方式为:先通过卷积层提取特征,形成特征图,再通过池化层,对所提取的特征图进行压缩;另一通道的处理方式为:利用卷积核对输入的训练集中的图片进行降维;这两个通道的处理结果经过级联层相连接;随后,再通过依次连接的第一紧密连接模块、第一过渡模块、第二紧密连接模块、第二过渡模块和第三紧密连接模块提取特征,特征提取完毕之后,将第三紧密连接模块的输出再通过归一化层、激活层、置换层和平化层进行后续的处理,最后得到输出层的结果;步骤2、先使用已有的用于自然场景下文本检测的卷积神经网络模型对测试图片中的文本信息进行定位和提取,对提取到的文本信息放入训练好的嵌入稀疏连接的深度卷积神经网络检测模型中,进行测试。2.根据权利要求1所述的一种嵌入稀疏连接的深度卷积神经网络字符识别方法,其特征在于,步骤1中对嵌入稀疏连接的深度卷积神经网络检测模型进行训练的具体过程如下:步骤1.1、将数据集中的图片统一截断成统一的大小,每张图片中包含固定个数的字符;同时,制作一个包含常用字的字典;每个字都对应一个唯一的序号,每张图片中每个字对应的序号所组成的序列就是这张图片的标签;将每张图片打上标签,并按照比例分为训练集和测试集;步骤1.2、载入该嵌入稀疏连接的深度卷积神经网络检测模型的预训练模型权重,开始训练该嵌入稀疏连接的深度卷积神经网络检测模型;步骤1.3、在训练过程中,设定提早停止的阈值为n,n为大于2且小于7的整数,如果n个迭代的最好测试集误差不相同,则返回步骤1.2,如果n个迭代...

【专利技术属性】
技术研发人员:徐琴珍曹钊铭张旭帆杨哲潘迪周宇杨绿溪
申请(专利权)人:东南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1