图像识别方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号：22102408 阅读：23 留言：0更新日期：2019-09-14 03:30

本发明专利技术公开了一种图像识别方法、装置、计算机设备及计算机可读存储介质，属于图像技术领域。本发明专利技术通过对待识别图像进行特征提取，生成第一特征图，基于该第一特征图中子图的特征点在该第一特征图中的重要程度，对该第一特征图进行解码，在解码过程中，当任一子图与前一子图中重要程度最大的特征点相对于该第一特征图的位置相同时，则可以确定该图像中包含的字符等有效信息均被解码，该计算机设备终止解码过程，根据获取的解码结果输出该图像中包含的字符等有效信息。这种图像识别方式，可以在解码过程中判断图像中的有效信息是否解码完成，从而提前终止解码过程，以减小图像识别过程中的运算量，提高图像识别效率。

Image Recognition Method, Device, Computer Equipment and Computer Readable Storage Media

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法、装置、计算机设备及计算机可读存储介质
本专利技术涉及图像
，特别涉及一种图像识别方法、装置、计算机设备及计算机可读存储介质。
技术介绍
随着机器学习技术的发展，计算机设备可以基于深度神经网络对图像中包含的字符等信息进行识别。目前，在图像识别任务中，通常采用基于深度神经网络构建的图像识别模型，对待识别的图像进行特征提取，获取图像的特征图，对特征图进行解码，以得到图像中包含的字符等信息。但是在图像中，字符等有效信息通常只占据图像的一部分区域，在有效信息以外还会出现较大的空白区域，在上述图像识别方式中，图像识别模型需对图像的每一区域都进行解码，对于不包含字符等有效信息的区域进行解码，会导致图像识别的运算量增大，图像识别的耗时增长，识别效率降低。
技术实现思路
本专利技术实施例提供了一种图像识别方法、装置、计算机设备及计算机可读存储介质，可以解决相关技术中图像识别效率低的问题。该技术方案如下：一方面，提供了一种图像识别方法，该方法包括：获取待识别的图像；将该图像输入图像识别模型，由该图像识别模型对该图像进行特征提取，得到第一特征图，基于该第一特征图中特征点在该第一特征图中的重要程度，对该第一特征图进行解码，当在解码过程中检测到该第一特征图中的任一子图和前一子图中重要程度最大的特征点在该第一特征图中的位置相同时，结束解码，输出解码得到的特征向量；对该图像识别模型输出的特征向量进行解码，得到该图像所包含的字符信息。一方面，提供了一种图像识别装置，该装置包括：获取模块，用于获取待识别的图像；输出模块，将该图像输入图像识别模型，由该图像识别模型对该图像进行...

【技术保护点】
1.一种图像识别方法，其特征在于，所述方法包括：获取待识别的图像；将所述图像输入图像识别模型，由所述图像识别模型对所述图像进行特征提取，得到第一特征图，基于所述第一特征图中特征点在所述第一特征图中的重要程度，对所述第一特征图进行解码，当在解码过程中检测到所述第一特征图中的任一子图和前一子图中重要程度最大的特征点在所述第一特征图中的位置相同时，结束解码，输出解码得到的特征向量；对所述图像识别模型输出的特征向量进行解码，得到所述图像所包含的字符信息。

【技术特征摘要】
1.一种图像识别方法，其特征在于，所述方法包括：获取待识别的图像；将所述图像输入图像识别模型，由所述图像识别模型对所述图像进行特征提取，得到第一特征图，基于所述第一特征图中特征点在所述第一特征图中的重要程度，对所述第一特征图进行解码，当在解码过程中检测到所述第一特征图中的任一子图和前一子图中重要程度最大的特征点在所述第一特征图中的位置相同时，结束解码，输出解码得到的特征向量；对所述图像识别模型输出的特征向量进行解码，得到所述图像所包含的字符信息。2.根据权利要求1所述的方法，其特征在于，所述基于所述第一特征图中特征点在所述第一特征图中的重要程度，对所述第一特征图进行解码，包括：获取所述第一特征图的多个第一序列，每个第一序列用于表示所述第一特征图中一个子图与扫描顺序位于所述子图前后的子图的特征信息；基于所述多个第一序列获取多个注意力矩阵，一个注意力矩阵用于表示对应的子图对于所述第一特征图的重要程度；基于所述多个注意力矩阵，对所述第一特征图进行解码。3.根据权利要求2所述的方法，其特征在于，所述获取所述第一特征图的多个第一序列，包括：将所述第一特征图中的各个子图依次输入编码器，所述编码器包括至少一个第一隐层单元；对于每个第一隐层单元，所述第一隐层单元对接收到的所述第一特征图的一个子图和上一个第一隐层单元输出的第一序列进行加权运算，得到一个第一序列。4.根据权利要求2所述的方法，其特征在于，所述基于所述多个第一序列获取多个注意力矩阵，包括：将全部第一序列输入解码器，所述解码器包括至少一个第二隐层单元；对于每一个第二隐层单元，所述第二隐层单元对接收的上一个第二隐层单元输出的一个第二序列与所述全部第一序列进行相似度比对，得到一个第二序列，所述第二序列中的一组元素用于指示所述上一个第二隐层单元的一个第二序列与一个第一序列的相似度，所述相似度越大，用于表示所述相似度的一组元素的数值越大；将多个第二序列分别与所述全部第一序列进行加权运算，生成多个注意力矩阵。5.根据权利要求2所述的方法，其特征在于，所述当在解码过程中检测到所述第一特征图中的任一子图和前一子图中重要程度最大的特征点在所述第一特征图中的位置相同时，结束解码，包括：获取所述子图的注意力矩阵中元素最大值相对于所述第一特征图的位置；当任一子图的注意力矩阵与前一子图的注意力矩阵中的元素最大值相对于所述第一特征图的位置相同时，则确定所述图像解码完成，结束解码。6.根据权利要求1所述的方法，其特征在于，所述对所述图像识别模型输出的特征向量进行解码，得到所述图像所包含的字符信息，包括：将所述多个特征向量分别与标准向量集合进行相似度比对，确定与各个特征向量相似度最大的多个标准向量，将所述多个标准向量所指示的字符作为所述图像包含的字符。7.一种图像识别装置，其特征在于，所述装置包括：获取模块，用于获取待识别的图像；输出模块，用于...

【专利技术属性】
技术研发人员：胡益清，姜德强，刘银松，叶朝萍，任博，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人