一种行为识别方法、处理器、芯片、电子设备和存储介质技术

技术编号:37913702 阅读:12 留言:0更新日期:2023-06-21 22:36
本申请实施例公开了一种行为识别方法,方法包括:对获得的初始待识别图像进行裁剪,得到目标待识别图像;将目标待识别图像输入至人脸检测模型,得到待识别人脸区域;对待识别人脸区域进行扩展处理,得到待识别人体区域;提取待识别人体区域中的待识别人体的人体行为特征;计算待识别人体的人体行为特征与人体行为样本特征之间的第一损失值,基于第一损失值得到待识别人体的行为的识别结果。本申请实施例同时还公开了一种处理器、芯片、电子设备和存储介质。存储介质。存储介质。

【技术实现步骤摘要】
一种行为识别方法、处理器、芯片、电子设备和存储介质


[0001]本申请涉及图像处理领域,尤其是涉及一种行为识别方法、处理器、芯片、电子设备和存储介质。

技术介绍

[0002]随着成像技术的发展,人们对相机成像质量的要求越来越高。在远距离成像的场景中,为了呈现更加清晰的画质,通过超高分辨率如8k相机采集超高分辨率如8k图像或视频,进而促使研究人员开发新的算法模型对超高分辨率图像中的小目标进行行为检测和行为识别。
[0003]相关技术中仅实现对超高分辨率图像中的小目标进行人脸检测和人脸识别,即通过利用小目标的高分辨率检测网络(High

Resolution Detection Network for Small Objects,HRDNET)中包括的深度信息和多尺度信息实现;其中,深度信息通过多深度图像金字塔网络(Multi

Depth Image Pyramid Network,MD

IPN)实现,多尺度信息通过多尺度初始人脸检测(Multi

Scale Feature Pyramid Network,MS

FPN)实现。这里,MD

IPN通过使用多深度主干模型保持位置信息,即将高分辨率输入到浅层网络,保持了更多位置信息的同时降低了计算量;将低层的卷积输入到深层网络中来提出更多语义信息。通过从高到低的卷积层提取小目标不同的特征来提升小目标的表现,同时,维持识别效果。MS

FPN这部分用来对齐和融合由MD

IPN生成的多尺度特征图,减少多尺度多深度特征之间的信息不平衡。可见,目前亟需提供一种新的行为识别的方案。

技术实现思路

[0004]本申请实施例期望提供一种行为识别方法、处理器、芯片、电子设备和存储介质,本申请提供的行为识别方法,至少具有如下有益效果:通过使用简单的人脸检测模型对人脸进行检测和识别,减少了计算量;进一步地,通过裁剪原始图像的方式,对人脸进行检测,减少了检测难度;同时,基于检测的人脸确定待识别人体区域,丰富了对人体行为进行识别的参考物类别,提高了对人体行为识别结果的准确性。
[0005]本申请的技术方案是这样实现的:
[0006]本申请提供一种行为识别方法,所述方法包括:
[0007]对获得的初始待识别图像进行裁剪,得到目标待识别图像;
[0008]将所述目标待识别图像输入至人脸检测模型,得到待识别人脸区域;
[0009]对所述待识别人脸区域进行扩展处理,得到待识别人体区域;
[0010]提取所述待识别人体区域中的待识别人体的人体行为特征;
[0011]计算所述待识别人体的人体行为特征与人体行为样本特征之间的第一损失值,基于所述第一损失值得到所述待识别人体的行为的识别结果。
[0012]本申请提供一种处理器,所述处理器包括:
[0013]第一处理模块,用于对获得的初始待识别图像进行裁剪,得到目标待识别图像;
[0014]第二处理模块,用于将所述目标待识别图像输入至人脸检测模型,得到待识别人脸区域;以及,对所述待识别人脸区域进行扩展处理,得到待识别人体区域,并提取所述待识别人体区域中的待识别人体的人体行为特征;
[0015]第三处理模块,用于计算所述待识别人体的人体行为特征与人体行为样本特征之间的第一损失值,并基于所述第一损失值得到所述待识别人体的行为的识别结果。
[0016]本申请提供一种芯片,包括处理器和存储器,所述处理器配置成执行:
[0017]对获得的初始待识别图像进行裁剪,得到目标待识别图像;
[0018]将所述目标待识别图像输入至人脸检测模型,得到待识别人脸区域;
[0019]对所述待识别人脸区域进行扩展处理,得到待识别人体区域;
[0020]提取所述待识别人体区域中的待识别人体的人体行为特征;
[0021]计算所述待识别人体的人体行为特征与人体行为样本特征之间的第一损失值,并基于所述第一损失值得到所述待识别人体的行为的识别结果。
[0022]本申请提供一种电子设备,所述电子设备包括芯片。
[0023]本申请提供一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,一个或者多个程序可被一个或者多个处理器执行,以实现上述的行为识别方法。
[0024]本申请实施例所提供的一种行为识别方法、处理器、芯片、电子设备和存储介质,通过对获得的初始待识别图像进行裁剪,得到目标待识别图像;将目标待识别图像输入至人脸检测模型,得到待识别人脸区域;对待识别人脸区域进行扩展处理,得到待识别人体区域;提取待识别人体区域中的待识别人体的人体行为特征;计算待识别人体的人体行为特征与人体行为样本特征之间的第一损失值,基于第一损失值得到待识别人体的行为的识别结果;也就是说,通过裁剪的方式对初始待识别图像进行处理,降低了对电子设备的显存的要求,并将目标待识别图像通过人脸检测模型得到待识别人脸区域;并对待识别人脸区域进行扩展,得到待识别人体区域;最后计算提取到的待识别人体的人体行为特征与人体行为样本特征之间的第一损失值,以根据第一损失值得到待识别人体的行为的识别结果。如此,通过使用简单的人脸检测模型对人脸进行检测和识别,减少了计算量;进一步地,通过裁剪原始图像的方式,对人脸进行检测,减少了检测难度;同时,基于检测的人脸确定待识别人体区域,丰富了对人体行为进行识别的参考物类别,提高了对人体行为识别结果的准确性。
附图说明
[0025]图1为本申请实施例提供的行为识别方法的一个可选的流程示意图;
[0026]图2为本申请实施例提供的损失函数的一个可选的示意图;
[0027]图3为本申请实施例提供的行为识别方法的一个可选的流程示意图;
[0028]图4为本申请实施例提供的行为识别方法的一个可选的流程示意图;
[0029]图5为本申请实施例提供的行为识别方法的一个可选的流程示意图;
[0030]图6为本申请实施例提供的裁剪图像的一个可选的示意图;
[0031]图7为本申请实施例提供的行为识别方法的一个可选的流程示意图;
[0032]图8为本申请实施例提供的人脸检测模型的一个可选的结构示意图;
[0033]图9为本申请实施例提供的处理器的一个可选的结构示意图;
[0034]图10为本申请实施例提供的芯片的一个可选的结构示意图。
具体实施方式
[0035]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0036]应理解,说明书通篇中提到的“本申请实施例”或“前述实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“本申请实施例中”或“在前述实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行为识别方法,其特征在于,所述方法包括:对获得的初始待识别图像进行裁剪,得到目标待识别图像;将所述目标待识别图像输入至人脸检测模型,得到待识别人脸区域;对所述待识别人脸区域进行扩展处理,得到待识别人体区域;提取所述待识别人体区域中的待识别人体的人体行为特征;计算所述待识别人体的人体行为特征与人体行为样本特征之间的第一损失值,基于所述第一损失值得到所述待识别人体的行为的识别结果。2.根据权利要求1所述的方法,其特征在于,对所述待识别人脸区域进行扩展处理,包括:将所述待识别人脸区域扩展到第一区域;计算所述第一区域与已识别人体库中的至少一个样本间的差异性度量;基于确定所述差异性度量小于第一阈值,将所述第一区域设为所述待识别人体区域。3.根据权利要求1所述的方法,其特征在于,提取所述待识别人体区域中的待识别人体的人体行为特征包括提取所述待识别人体区域的深度特征。4.根据权利要求1所述的方法,其特征在于,所述第一损失值与基于角度空间的第一损失函数中的特征类别的第一角度和第一角度间隔对应,其中,所述第一损失函数用于计算所述第一损失值。5.根据权利要求1所述的方法,其特征在于,所述对获得的初始待识别图像进行裁剪,得到目标待识别图像,包括:获取训练样本图像中存在人体的多个区域中面积最大的目标区域,其中,所述人体在对应的所述训练样本图像中的占比小于占比阈值;基于所述初始待识别图像的大小和所述目标区域的大小,确定滑动窗口的大小和移动步长;在所述初始待识别图像上,按照所述移动步长移动所述滑动窗口,得到裁剪的具有所述滑动窗口的大小的所述目标待识别图像。6.根据权利要求5所述的方法,其特征在于,所述目标区域为矩形,所述基于所述初始待识别图像的大小和所述目标区域的大小,确定滑动窗口的大小和移动步长,包括:获取所述目标区域的第一长度和第一宽度;基于所述初始待识别图像的大小,确定所述滑动窗口的大小;基于所述第一长度确定第一移动步长,并基于所述第一宽度确定第二移动步长,其中,所述第一移动步长为所述第一长度的整数倍,所述第二移动步长为所述第一宽度的整数倍。7.根据权利要求6所述的方法,其特征在于,所述在所述初始待识别图像上,按照所述移动步长移动所述滑动窗口,得到裁剪的具有所述滑动窗口的大小的所述目标待识别图像,包括:在所述初始待识别图像的长度方向上,按照所述第一移动步长移动所述滑动窗口,得到裁剪的具有所述滑动窗口的大小的第一待识别图像;在所述初始待识别图像的宽度方向上,按照所述第二移动步长移动所述滑动窗口,得到裁剪的具有所述滑动窗口的大小的第二待识别图像,其中,所述目标待识别图像包括所
述第一待识别图像和所述第二待识别图像。8.根据权利要求6所述的方法,所述第一移动步长为所述第一长度的两倍,所述第二移动步长为所述第一宽度的两倍。9....

【专利技术属性】
技术研发人员:赵娟萍
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1