基于多角度视频的动作识别方法及相关设备技术

技术编号：30974642 阅读：22 留言：0更新日期：2021-11-25 21:00

本发明专利技术实施例公开了一种基于多角度视频的动作识别方法及相关设备，相关实施例可应用于云技术、云安全、人工智能、智慧交通等各种场景。其中，该方法包括：获取对目标对象采集的多角度的N个检测视频，并在对每个检测视频进行图像帧抽取处理和加权融合处理后，得到用于对检测视频中的目标对象在相应拍摄角度下执行的动作信息进行记录的动作描述图，那么，通过对动作描述图的信息融合处理，可得到记录了目标对象在多个不同拍摄角度下的动作信息的动作融合描述图，进而基于对该动作融合描述图的识别处理，可得到针对目标对象是否执行了目标动作的识别结果，基于对多角度的动作信息的结合识别过程，可提升对目标动作进行动作识别的准确度。准确度。准确度。

全部详细技术资料下载

【技术实现步骤摘要】
基于多角度视频的动作识别方法及相关设备

[0001]本申请涉及计算机
，尤其涉及一种基于多角度视频的动作识别方法及相关设备。

技术介绍

[0002]随着互联网技术的不断深入发展，可采用计算机技术辅助用户的生产和生活，如可基于计算机技术辅助用户进行动作的判别等。而当前在基于计算机技术进行动作判别时，主要是通过对用户佩戴设备的传感器的采集数据的分析进行确定的，而由于用户佩戴设备中的传感器的精度较低，且在环境中受到干扰能力差，那么自然地，基于对传感器的采集数据进行分析，从而进行动作判别的方式存在准确度较低的问题。

技术实现思路

[0003]本申请实施例提供了一种基于多角度视频的动作识别方法及相关设备，可提升对目标视频数据中的对象进行目标动作识别时的准确度。
[0004]一方面，本专利技术实施例提供了一种基于多角度视频的动作识别方法，包括：获取针对目标对象采用多个不同的拍摄角度拍摄得到的N个检测视频，其中，所述N为大于等于2的正整数；对所述N个检测视频进行图像帧抽取处理和加权融合处理，得到M个动作描述图，其中，所述M为正整数，一个动作描述图用于对检测视频中的目标对象在相应拍摄角度下执行的动作信息进行记录；对每个动作描述图记录的动作信息进行信息融合处理，得到用于描述所述目标对象在多个不同拍摄角度的动作信息的动作融合描述图；根据所述动作融合描述图对所述目标对象执行的动作进行识别处理，得到针对所述目标对象的动作识别结果，所述动作识别结果用于表征所述目标对象是否执行目标动作。
[0005]再一方...

【技术保护点】

【技术特征摘要】
1.一种基于多角度视频的动作识别方法，其特征在于，包括：获取针对目标对象采用多个不同的拍摄角度拍摄得到的N个检测视频，其中，N为大于等于2的正整数；对所述N个检测视频进行图像帧抽取处理和加权融合处理，得到M个动作描述图，其中，M为正整数，一个动作描述图用于对检测视频中的目标对象在相应拍摄角度下执行的动作信息进行记录；对每个动作描述图记录的动作信息进行信息融合处理，得到用于描述所述目标对象在多个不同拍摄角度的动作信息的动作融合描述图；根据所述动作融合描述图对所述目标对象执行的动作进行识别处理，得到针对所述目标对象的动作识别结果，所述动作识别结果用于表征所述目标对象是否执行目标动作。2.如权利要求1所述的方法，其特征在于，任一动作描述图是通过调用多分枝卷积神经网络的一个分枝网络，对任一检测视频进行图像帧抽取处理和加权融合处理后得到的，所述多分枝卷积神经网络还包括主干网络；所述对每个动作描述图记录的动作信息进行信息融合处理，得到用于描述所述目标对象在多个不同拍摄角度的动作信息的动作融合描述图，包括：调用任一分枝网络对所述M个动作描述图中的任一动作描述图所记录的动作信息进行提取，得到所述任一动作描述图在对应拍摄角度下的动作信息；调用所述主干网络对由每个动作描述图提取到的对应拍摄角度下的动作信息进行信息融合处理，得到用于描述所述目标对象在多个不同拍摄角度的动作信息的动作融合描述图。3.如权利要求1所述的方法，其特征在于，一个动作描述图是对一个检测视频进行图像帧抽取处理和加权融合处理得到的；得到任一动作描述图的方式包括：对任一检测视频进行图像帧抽取处理，得到所述任一检测视频的一个或多个参考图像帧；获取任一参考图像帧对应的重要度分数，所述重要度分数用于表征相应参考图像帧的重要程度；采用重要度分数对相应参考图像帧进行加权求和，得到所述任一检测视频对应的动作描述图。4.如权利要求3所述的方法，其特征在于，所述对任一检测视频进行图像帧抽取处理，得到所述任一检测视频的一个或多个参考图像帧，包括：基于任一检测视频中各图像帧的显示顺序对所述任一检测视频进行图像帧抽取处理，得到所述任一检测视频对应的表征序列，将所述表征序列中包括的图像帧作为参考图像帧，或者；获取滑动窗口，并基于所述滑动窗口对所述任一检测视频进行图像帧抽取处理，将处于所述滑动窗口内的图像帧作为参考图像帧。5.如权利要求3所述的方法，其特征在于，所述获取任一参考图像帧对应的重要度分数，包括：获取用于表征所述一个或多个参考图像帧中的任一参考图像帧在对应检测视频中的显示时间的时间序列，所述时间序列包括的一个显示时间与一个参考图像帧相对应；
基于所述时间序列，对所述任一参考图像帧的显示时间进行调和处理，得到用于表征相应显示时间在进行动作描述时的时间重要度；将所述时间重要度作为与相应显示时间对应的任一参考图像帧的重要度分数。6.如权利要求3所述的方法，其特征在于，所述采用重要度分数对相应参考图像帧进行加权求和，得到所述任一检测视频对应的动作描述图，包括：若采用第一算法得到动作描述图，则获取所述一个或多个参考图像帧中每个参考图像帧的特征向量；采用任一参考图像帧的重要度分数，对相应特征向量进行加权求和，得到所述任一检测视频的表征向量；对所述表征向量进行还原重构处理，得到所述任一检测视频的动作描述图。7.如权利要求6所述的方法，其特征在于，所述第一算法由第一表达式进行表示；所述方法还包括：获取动作描述图的理论表达式，并对所述理论表达式进行一步近似求导处理，得到所述动作描述图的近似表达式，所述近似表达式用于表征在所述动作描述图中对应像素变化的梯度变...

【专利技术属性】
技术研发人员：丁强刚，黄予，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人