音视频数据处理方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:43114522 阅读:15 留言:0更新日期:2024-10-26 09:53
本申请公开了一种音视频数据处理方法、装置、电子设备及可读存储介质,属于人工智能技术领域。本申请实施例中的音视频数据处理方法,应用于电子设备,包括:对获取的视频数据进行关键点定位;获取与每帧图像数据对应的音频数据;利用每帧图像数据对应的音频数据和关键点数据计算每帧图像数据的重要性估计值;选取重要性估计值大于预设阈值的目标视频数据;根据所述目标视频数据及其对应的音频数据进行异常行为识别。由此,可以提升异常行为检测的准确率以及运算速度。

【技术实现步骤摘要】

本申请属于人工智能,具体涉及一种音视频数据处理方法、装置、电子设备及可读存储介质


技术介绍

1、在智慧家庭、智慧养老、自动驾驶等领域,对于异常行为的识别扮演着重要的角色。例如,在智慧养老应用下,精准识别老年人跌倒、胸痛等异常行为对于保障老年人安全健康有着重要的意义。

2、现有的异常行为识别方案主要基于视频等单模态数据进行异常行为识别,或者直接将语音与视频数据进行融合以实现异常行为检测。对于基于视频等单模态数据进行异常行为识别的方案,其精准度往往十分有限。对于将语音与视频数据进行融合以实现异常行为检测的方案,其单帧输入数据规模量大,往往不利于在端侧进行实时异常行为检测,因此其应用场景有限。

3、此外,现有的端侧技术方案往往会等间隔选取视频帧来进行异常行为检测,从而减少计算量。然而,这种选取方式可能会将异常行为发生时的数据丢弃,因此影响检测精准度。


技术实现思路

1、本申请实施例的目的是提供一种音视频数据处理方法、装置、电子设备及可读存储介质,能够提升异常行为检测的准确率以及运算速度。<本文档来自技高网...

【技术保护点】

1.一种音视频数据处理方法,应用于电子设备,其特征在于,包括:

2.根据权利要求1所述的音视频数据处理方法,其特征在于,所述获取与每帧图像数据对应的音频数据包括:

3.根据权利要求1所述的音视频数据处理方法,其特征在于,所述利用每帧图像数据对应的音频数据和关键点数据计算每帧图像数据的重要性估计值包括:

4.根据权利要求3所述的音视频数据处理方法,其特征在于,利用存算一体阵列计算每帧图像数据的重要性估计值。

5.根据权利要求4所述的音视频数据处理方法,其特征在于,所述存算一体阵列包括N+M行和3列,其中,N为每帧图像数据中关键点的数量,M为每...

【技术特征摘要】

1.一种音视频数据处理方法,应用于电子设备,其特征在于,包括:

2.根据权利要求1所述的音视频数据处理方法,其特征在于,所述获取与每帧图像数据对应的音频数据包括:

3.根据权利要求1所述的音视频数据处理方法,其特征在于,所述利用每帧图像数据对应的音频数据和关键点数据计算每帧图像数据的重要性估计值包括:

4.根据权利要求3所述的音视频数据处理方法,其特征在于,利用存算一体阵列计算每帧图像数据的重要性估计值。

5.根据权利要求4所述的音视频数据处理方法,其特征在于,所述存算一体阵列包括n+m行和3列,其中,n为每帧图像数据中关键点的数量,m为每帧图像数据对应的音频数据的帧数,所述存算一体阵列的第一列用于计算所述第一位置数据的加权值,所述存算一体阵列的第二列用于计算所述第二位置数据的加权值,所述存算一体阵列的第三列用于计算所述音频数据的...

【专利技术属性】
技术研发人员:高若飞祝淑琼潘卫平李昊姚燕玲张童
申请(专利权)人:中国移动通信有限公司研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1