视频处理方法技术

技术编号：39674012 阅读：9 留言：0更新日期：2023-12-11 18:40

本发明专利技术公开了一种视频处理方法

全部详细技术资料下载

【技术实现步骤摘要】
视频处理方法、装置、电子设备及存储介质

[0001]本专利技术涉及计算机处理
，尤其涉及一种视频处理方法
、
装置
、
电子设备及存储介质
。

技术介绍

[0002]随着教学信息化的发展，对教学质量的监控也越来越重要，需要对上课过程中学生的上课状态进行监控分析，进而通过分析结果来规范教学情况
。
[0003]在现有技术中，教学监控的方式通常是通过采集学生上课视频，进而对学生上课视频中的图像进行举手检测，分析学生的举手状态，以此来反映出学生上课的具体程度，进而判断上课的效果
。
但是，上课过程中存在各种偶然性，图片检测的方式会导致教学评估出错的问题
。

技术实现思路

[0004]本专利技术提供了一种视频处理方法
、
装置
、
电子设备及存储介质，以实现提高举手回答视频确定的精确性，进而提高教学评估的准确性和有效性
。
[0005]根据本专利技术的一方面，提供了一种视频处理方法，该方法包括：
[0006]获取待提取的教学视频，并从所述教学视频中提取多帧待识别图像以及语音数据；
[0007]对于所述多帧待识别图像，若对所述待识别图像的识别结果为预设动作，则确定与所述待识别图像相对应的举手时刻；
[0008]对所述语音数据进行识别处理，得到与预设角色相对应的目标对象的语音片段，并确定所述语音片段的起始语音时刻；
[0009]基于所述举手时刻以及所...

【技术保护点】

【技术特征摘要】
1.
一种视频处理方法，其特征在于，包括：获取待提取的教学视频，并从所述教学视频中提取多帧待识别图像以及语音数据；对于所述多帧待识别图像，若对所述待识别图像的识别结果为预设动作，则确定与所述待识别图像相对应的举手时刻；对所述语音数据进行识别处理，得到与预设角色相对应的目标对象的语音片段，并确定所述语音片段的起始语音时刻；基于所述举手时刻以及所述起始语音时刻，从所述教学视频中确定举手回答视频片段，以根据所述举手回答视频片段评估所述教学视频的教学质量
。2.
根据权利要求1所述的方法，其特征在于，所述对所述语音数据进行识别处理，得到与预设角色相对应的目标对象的语音片段，包括：基于角色分离算法对所述语音数据进行分离处理，确定不同对象对应的语音总时长；基于各所述语音总时长，从所述不同对象中确定与所述预设角色相对应的目标对象；其中，所述预设角色包括举手回答方；确定所述目标对象的语音片段
。3.
根据权利要求1所述的方法，其特征在于，所述基于所述举手时刻以及所述起始语音时刻，从所述教学视频中确定举手回答视频片段，包括：若在距离所述举手时刻后的预设时长内存在相匹配的起始语音时刻，则基于所述举手时刻以及所述起始语音时刻所属的语音片段的终止语音时刻，确定举手回答视频片段
。4.
根据权利要求1所述的方法，其特征在于，还包括：获取多个训练样本，所述训练样本包括待训练图像以及与所述待训练图像相对应的标注结果；基于所述多个训练样本训练得到目标举手检测模型，以基于所述目标举手检测模型对所述待识别图像进行处理，得到对所述待识别图像的识别结果
。5.
根据权利要求4所述的方法，其特征在于，所述基于所述多个训练样本训练得到目标举手检测模型，包括：将所述多个训练样本中的待训练图像输入至待训练举手检测模型中，基于所述待训练举手检测模型中的数据增强模型分别对每个待训练图像组进行处理，得到与每个待训练图像组相对应的拼接图像；所述待训练图像组中包括预设数量的待训练图像；所述拼接图像中的标注结果的数量与所述预设数量相对应；对于各所述拼接图像，基于所述待训练举手检测模型中的骨干网络对所述拼接图像进行处理，得到输出标签；基于所述拼接图像中的标注结果以及所述输出标签，确定损失值；基于所述损失值对所述待训练举手检测模型中的模型参数进行修正；将所述待训练举手检测模型的损失函数收敛作为训练目标，得到所述目标举手检测模型
。6.
根据权利要求5所述的方法，其特征在于，所述骨干网络包括第一模块和第二模块；所述第一模块由多个卷积层
、
多个
C3
模块和
SPPF
模块组成；所述基于所述待训练举手检测模型中的骨干网络对所述拼接图像进行处理，得到输出标签，包括：基于所述骨干网络中的第...

【专利技术属性】
技术研发人员：陈嘉，
申请(专利权)人：北京智慧荣升科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人