图像分析方法、装置及电子设备制造方法及图纸

技术编号：35016602 阅读：36 留言：0更新日期：2022-09-21 15:21

本发明专利技术提供一种图像分析方法、装置及电子设备，涉及计算机视觉技术领域，该图像分析方法包括：获取目标视觉任务的待分析图像；将待分析图像输入视觉分析模型，获得视觉分析模型输出的待分析图像中针对目标视觉任务的每一个目标物体特征的属性序列；该视觉分析模型用于基于目标视觉任务对待分析图像进行图像特征中目标物体特征的提取，并生成描述目标物体特征的属性序列；该视觉分析模型是基于目标视觉任务对应的样本图像和样本图像对应的标签数据训练得到的。本发明专利技术提供的技术方案能够将不同视觉任务统一成对待分析图像中物体的序列描述问题，视觉分析模型在多种视觉任务上具有通用性，提高了视觉任务处理的效率并降低了开发成本。开发成本。开发成本。

全部详细技术资料下载

【技术实现步骤摘要】
图像分析方法、装置及电子设备

[0001]本专利技术涉及计算机视觉
，尤其涉及一种图像分析方法、装置及电子设备。

技术介绍

[0002]计算机视觉是使用计算机模仿人类视觉系统的科学，能够使计算机拥有类似人类提取、处理、理解和分析图像及图像序列的能力，在安防、制造、政务、医疗等领域中发挥着越来越重要的作用。
[0003]在计算机视觉任务中，不同于自然语言可以被建模成序列至序列的特点，视觉任务的定义通常有着巨大的差异，不同的视觉任务需要设计不同的模型结构分别处理。虽然目前有提出用统一的视觉分析模型处理多个视觉任务，比如多任务学习，但这种方式主要是将多个任务的专用模型结构和一个共享的主干模型网络进行共同训练，只能处理有限且固定的任务组合，一旦有新的任务出现，又需要额外设计新的模型结构并重新训练，任务处理效率低且开发成本较高。

技术实现思路

[0004]本专利技术提供一种图像分析方法、装置及电子设备，用以解决现有技术中不同的视觉任务需要使用不同结构的模型进行处理而导致处理效率低且开发成本高的缺陷，实现多种视觉任务输出结果的统一序列化表示。
[0005]本专利技术提供一种图像分析方法，包括：获取目标视觉任务的待分析图像；将所述待分析图像输入视觉分析模型，获得所述视觉分析模型输出的所述待分析图像中针对所述目标视觉任务的每一个目标物体特征的属性序列；其中，所述视觉分析模型用于基于所述目标视觉任务对所述待分析图像进行图像特征中目标物体特征的提取，并生成描述所述目标物体特征的属性序列；所述视觉分析...

【技术保护点】

【技术特征摘要】
1.一种图像分析方法，其特征在于，包括：获取目标视觉任务的待分析图像；将所述待分析图像输入视觉分析模型，获得所述视觉分析模型输出的所述待分析图像中针对所述目标视觉任务的每一个目标物体特征的属性序列；其中，所述视觉分析模型用于基于所述目标视觉任务对所述待分析图像进行图像特征中目标物体特征的提取，并生成描述所述目标物体特征的属性序列；所述视觉分析模型是基于所述目标视觉任务对应的样本图像和所述样本图像对应的标签数据训练得到的。2.根据权利要求1所述的图像分析方法，其特征在于，所述将所述待分析图像输入视觉分析模型，获得所述视觉分析模型输出的所述待分析图像中针对目标视觉任务的每一个目标物体特征的属性序列，包括：将所述待分析图像输入所述视觉分析模型的图像特征编码层，获得所述图像特征编码层输出的所述待分析图像的图像特征；将所述图像特征输入所述视觉分析模型的自注意力解码层，获得所述自注意力解码层输出的所述图像特征中针对所述目标视觉任务的目标物体特征；将所述目标物体特征输入所述视觉分析模型的序列生成层，获得所述序列生成层输出的所述目标物体特征的属性序列。3.根据权利要求2所述的图像分析方法，其特征在于，所述序列生成层按照时序输出所述目标物体特征的属性序列；所述序列生成层包括序列自注意力层、图像互注意力层和线性层；所述序列自注意力层，用于以当前时刻的输入特征为查询、当前时刻的输入特征及之前所有的输入特征为键值对，进行自注意力计算；所述图像互注意力层，用于以所述图像特征为键值，对所述序列自注意力层的输出进行互注意力计算；所述线性层，用于对所述图像互注意力层的输出进行数值化处理，得到所述属性序列。4.根据权利要求3所述的图像分析方法，其特征在于，所述将所述目标物体特征输入所述视觉分析模型的序列生成层，获得所述序列生成层输出的所述目标物体特征的属性序列，包括：将所述图像互注意力层前一时刻的输出特征作为当前时刻的输入特征输入所述序列自注意力层，获得所述序列自注意力层输出的当前时刻的自注意力值，所述序列自注意力层初始时刻的输入特征为所述目标物体特征；将所述当前时刻的自注意力值输入所述图像互注意力层，获得所述图像互注意力层输出的当前时刻的输出特征；将所述当前时刻的输出特征输入所述线性层，获得所述线性层输出的当...

【专利技术属性】
技术研发人员：朱优松，陈志扬，赵朝阳，李朝闻，王金桥，唐明，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人