基于图像融合的行为识别方法、装置、电子设备及介质制造方法及图纸

技术编号：31378422 阅读：21 留言：0更新日期：2021-12-15 11:19

本发明专利技术涉及人工智能技术领域，提供一种基于图像融合的行为识别方法、装置、电子设备及介质，通过将初始图像与计算得到的光流图像进行融合，实现了图像信息与时间信息的融合，且通过光流信息指导3D卷积神经网络对于初始图像的信息的理解，通过注意力机制让3D卷积神经网络学习更多的感兴趣信息，从而基于融合后的融合图像进行行为识别，有效的保证了行为识别的准确度；训练的3D卷积神经网络为单分支网络结构，相比双分支的3D卷积神经网络而言，在保证行为识别准确率的前提下，单分支网络结构降低了网络模型的复杂度，从而降低了整个行为识别过程的复杂度，让整个过程更加集中化，提高了行为识别的效率。了行为识别的效率。了行为识别的效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于图像融合的行为识别方法、装置、电子设备及介质

[0001]本专利技术涉及人工智能
，具体涉及一种基于图像融合的行为识别方法、装置、电子设备及介质。

技术介绍

[0002]行为识别是计算机视觉领域非常有挑战性的课题，因为其不仅仅要分析目标体的空间信息，还要分析时间维度上的信息。如何更好的提取出空间
‑
时间特征是问题的关键。随着深度神经网络在目标检测方面的广泛应用和取得的良好效果，人们也探索使用神经网络进行动作识别。
[0003]专利技术人在实现本专利技术的过程中发现，现有技术中通过设置两个网络，一个网络用于处理图像空间，另一个网络用于处理时间信息，最后利用SVM将这两个网络的输出关联起来，实现目标体的静态和动态的融合，从而实现行为的识别。但该方法由于设置了两个网络结构，导致网络结构较为复杂，且需要同时训练两个网络，导致模型训练复杂度加大，训练效率较低，从而导致行为识别的效率较低。

技术实现思路

[0004]鉴于以上内容，有必要提出一种基于图像融合的行为识别方法、装置、电子设备...

【技术保护点】

【技术特征摘要】
1.一种基于图像融合的行为识别方法，其特征在于，所述方法包括：响应于识别目标对象的行为的指令，获取包含所述目标对象的视频流；从所述视频流中提取多个初始图像；对所述多个初始图像进行光流计算得到多个光流图像；基于注意力机制将每个所述初始图像与对应的所述光流图像进行融合，得到多个融合图像；将所述多个融合图像输入至预先训练完成的3D卷积神经网络中进行行为识别，其中，所述预先训练完成的3D卷积神经网络为单分支网络结构。2.如权利要求1所述的基于图像融合的行为识别方法，其特征在于，在从所述视频流中提取多个初始图像之后，所述方法还包括：检测每个所述初始图像中所述目标对象对应的目标区域；对每个所述初始图像中的目标区域进行裁剪，得到目标图像；对多个所述目标图像进行采样，得到多个采样图像；所述对所述多个初始图像进行光流计算得到多个光流图像包括：对所述多个采样图像进行光流计算得到多个光流图像。3.如权利要求2所述的基于图像融合的行为识别方法，其特征在于，所述对多个所述目标图像进行采样，得到多个采样图像包括：获取每个所述目标图像的尺寸；根据所述尺寸对每个所述目标图像进行第一采样得到第一采样图像，及对每个所述目标图像进行第二采样得到第二采样图像；计算每个所述第一采样图像的第一图像质量，及计算每个所述第二采样图像的第二图像质量；比较多个所述第一图像质量及多个所述第二图像质量，得到比较结果；根据所述比较结果确定多个采样图像。4.如权利要求3所述的基于图像融合的行为识别方法，其特征在于，所述根据所述尺寸对每个所述目标图像进行第一采样得到第一采样图像，及对每个所述目标图像进行第二采样得到第二采样图像包括：获取多个所述尺寸中的最大尺寸及最小尺寸；根据所述最大尺寸确定每个所述目标图像的第一采样率，根据所述最小尺寸确定每个所述目标图像的第二采样率；根据所述第一采样率对对应的所述目标图像进行上采样得到第一采样图像，根据所述第二采样率对对应的所述目标图像进行下采样得到第二采样图像。5.如权利要求3所述的基于图像融合的行为识别方法，其特征在于，所述根据所述比较结果确定多个采样图像包括：当所述比较结果为多个所述第一图像质量的平均值大...

【专利技术属性】
技术研发人员：郑喜民，苏杭，舒畅，陈又新，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人