一种时序注意力机制场景图像识别方法技术

技术编号：30972132 阅读：33 留言：0更新日期：2021-11-25 20:53

本发明专利技术涉及一种时序注意力机制场景图像识别方法，属于图像处理技术领域。本发明专利技术在现有Transformer模型的基础上进行改进，在解码器部分使用两步注意力解码机制，通过第一注意力机制得到注意力特征图，第二注意力机制关注特征序列内部的时序关系，经过多个时间步解码出图像中的字符串。通过两步注意力机制能够对过度曝光、伪影、模糊、字符显示不全等图片中字符串进行准确的识别，拥有较好的鲁棒性和泛化能力。此外，本发明专利技术还引入了CTC算法辅助训练，以避免由于字符失真等因素，使得对输入图像特征分区域识别时，相邻的区域可能被识别为同一个字符的问题，进一步提高识别的准确性。进一步提高识别的准确性。进一步提高识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种时序注意力机制场景图像识别方法

[0001]本专利技术涉及一种时序注意力机制场景图像识别方法，属于图像处理

技术介绍

[0002]工业机械仪表被广泛应用于国防、交通和工业等领域，如燃气行业，工业燃气已经成为国内目前使用占比最高的能源。机械燃气表安装起来方便快捷，而且使用周期长，但是需要工人手动抄表，抄表过程相当麻烦，而且成本高，周期长，误差大等，使得工厂无法快速、准确地掌握工业生产中的实时数据，影响工业智能化的发展和进步。
[0003]为此，有人提出了通过采用表盘图像，通过图像识别的方式自动实现查表。因为自然场景中的工业仪表可能受到天气，光照，角度等难以预见的因素影响，导致工业仪表成像质量差，传统的工业仪表识别算法不能很好地识别极端情况下的工业仪表图像，导致从中识别出的字符串的准确降低，进行影响后续数据的处理的精度。

技术实现思路

[0004]本专利技术的目的是提供一种时序注意力机制场景图像识别方法，以解决目前识别方法无法准确识别出成像质量差的图像中的字符信息。
[0005]本专...

【技术保护点】

【技术特征摘要】
1.一种时序注意力机制场景图像识别方法，其特征在于，该识别方法包括以下步骤：1)获取包含有字符串的待识别图像数据，并对其进行预处理，得到设定大小的灰度图像；2)将预处理后得到的设定大小的灰度图像输入到已训练的识别模型中，由已训练的识别模型进行处理，识别出待识别图像中的字符串；所述的识别模型为时序上下文注意力模型，该模型包括有特征提取模块、编码器和解码器，所述特征提取模块采用卷积神经网络用于对输入的灰度图像进行特征提取；所述编码器为Transformer模型编码器，用于对图像特征进行编码；所述的解码器采用两步注意力机制，其中第一注意力机制用于得到注意力特征图，第二注意力机制用于根据特征序列内部的时序关系，经过多个时间步解码出图像中的字符串。2.根据权利要求1所述的时序注意力机制场景图像识别方法，其特征在于，所述编码器还包括CTC模块，用于对输入特征进行对齐数据标签的操作。3.根据权利要求1或2所述的时序注意力机制场景图像识别方法，其特征在于，所述的第一注意力机制通过全连接层计算出输入特征的注意力图，然后将输入特征乘以注意力图产生注意力特征D
′
。4.根据权利要求1或2所述的时序注意力机制场景图像识别方法，其特征在于，所述的第二注意力机制用于对第一注意力机制生成的注意力特征D
′
进行解码，每个时间步t都会解码出一个字符y
t
，时间步的数量等于数据集最长字符串的长度加一。5.根据权利要求4所述的时序注意力机制场景图像识别方法，其特征在于，所述的第二注意力机制包括若干个LSTM单元。6.根据权利要求2所述的时序注意力机制场景图像识别方法，其特征在...

【专利技术属性】
技术研发人员：李卫东，王帅，汪驰升，白林燕，徐小蕊，韩恒刚，刘甲，梁鑫婕，
申请(专利权)人：河南工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人