视频标注模型训练方法、视频标注方法、装置以及设备制造方法及图纸

技术编号：38007487 阅读：15 留言：0更新日期：2023-06-30 10:25

本申请涉及一种视频标注模型训练方法、视频标注方法、装置以及设备。所述视频标注模型训练方法包括：获取视频数据样本中的第N帧图像样本、所述第N帧图像样本的第N帧标注信息、第N+1帧图像样本以及所述第N+1帧图像样本的样本标注信息，其中，N为正整数；将所述第N帧图像样本、所述第N帧标注信息以及所述第N+1帧图像样本输入初始标注模型，得到所述初始标注模型输出的与所述第N+1帧图像样本对应的预标注信息；计算所述预标注信息和所述样本标注信息的匹配程度，根据所述匹配程度对所述初始标注模型的模型参数进行迭代更新，得到训练后的视频标注模型。采用本方法能够提高视频标注的效率，提升汽车对于物体检测的性能。提升汽车对于物体检测的性能。提升汽车对于物体检测的性能。

全部详细技术资料下载

【技术实现步骤摘要】
视频标注模型训练方法、视频标注方法、装置以及设备

[0001]本申请涉及计算机视觉
，特别是涉及一种视频标注模型训练方法、视频标注方法、装置以及设备。

技术介绍

[0002]物体检测是计算机视觉技术中的经典问题之一，随着机器学习模型的发展，在自动驾驶领域中，常通过计算机视觉技术来检测目标物体。
[0003]目前，对于自动驾驶过程中采集到的视频数据，标注员会用2D包围框的形式将目标物体进行标注，以框选出汽车需要检测的目标物体，但标注工作的需求量大、成本高，传统的视频标注方法效率低下，进而影响到自动驾驶汽车对于物体检测的性能提升。

技术实现思路

[0004]基于此，提供一种视频标注模型训练方法、视频标注方法、装置以及设备，改善现有技术中视频标注效率低下的问题。
[0005]一方面，提供一种视频标注模型训练方法，所述方法包括：
[0006]获取视频数据样本中的第N帧图像样本、所述第N帧图像样本的第N帧标注信息、第N+1帧图像样本以及所述第N+1帧图像样本的样本标注信息，其中，N为正整数；
[0007]将所述第N帧图像样本、所述第N帧标注信息以及所述第N+1帧图像样本输入初始标注模型，得到所述初始标注模型输出的与所述第N+1帧图像样本对应的预标注信息；
[0008]计算所述预标注信息和所述样本标注信息的匹配程度，根据所述匹配程度对所述初始标注模型的模型参数进行迭代更新，得到训练后的视频标注模型。
[0009]在其中一个实施例中，将所述第N帧图像样本、所述第...

【技术保护点】

【技术特征摘要】
1.一种视频标注模型训练方法，其特征在于，包括：获取视频数据样本中的第N帧图像样本、所述第N帧图像样本的第N帧标注信息、第N+1帧图像样本以及所述第N+1帧图像样本的样本标注信息，其中，N为正整数；将所述第N帧图像样本、所述第N帧标注信息以及所述第N+1帧图像样本输入初始标注模型，得到所述初始标注模型输出的与所述第N+1帧图像样本对应的预标注信息；计算所述预标注信息和所述样本标注信息的匹配程度，根据所述匹配程度对所述初始标注模型的模型参数进行迭代更新，得到训练后的视频标注模型。2.根据权利要求1所述的视频标注模型训练方法，其特征在于，所述将所述第N帧图像样本、所述第N帧标注信息以及所述第N+1帧图像样本输入初始标注模型，得到所述初始标注模型输出的与所述第N+1帧图像样本对应的预标注信息，包括：对所述第N帧图像样本和所述第N+1帧图像样本进行特征提取，得到第N帧特征图和第N+1帧特征图；将所述第N帧特征图和所述第N+1帧特征图进行合并，计算所述第N帧特征图中的像素点在所述第N+1帧特征图中的位置偏移，得到像素偏移信息；根据所述像素偏移信息对所述第N+1帧特征图进行插值处理，得到第N+1帧扭曲特征图；将所述第N帧特征图和所述第N+1帧扭曲特征图进行合并，得到特征合并图，根据所述第N帧标注信息对所述特征合并图进行特征截取，得到特征截取图；根据所述特征截取图进行物体偏移估计，得到所述第N+1帧图像样本的所述预标注信息。3.根据权利要求2所述的视频标注模型训练方法，其特征在于，所述对所述第N帧图像样本和所述第N+1帧图像样本进行特征提取，得到第N帧特征图和第N+1帧特征图，包括：对所述第N帧图像样本和所述第N+1帧图像样本进行卷积运算和下采样，得到高维度特征图；对所述高维度特征图进行上采样和跳层连接，得到所述第N帧特征图和所述第N+1帧特征图。4.根据权利要求2所述的视频标注模型训练方法，其特征在于，所述根据所述第N帧标注信息对所述特征合并图进行特征截取，得到特征截取图，包括：将所述特征合并图和所述第N帧标注信息进行对应，获取所述特征合并图中的标注区域；对所述标注区域进行插值处理，以截取所述标注区域中的特征信息，并对所述特征信息的长宽规格进行调整，得到所述特征截取图。5.根据权利要求2至4中任一项所述的视频标注模型训练方法，其特征在于，所述根据所述特征截取图进行物体偏移估计，得到所述第N+1帧图像样本的所述预标注信息，包括：根据预设的损失函数对所述特征截取图进行回归计算，得到所述第N+1帧图像样本的所述预标注信息。6.一种视频标注方法，其特征在于，所述方法包括：获取待标注的视频数据，根据接收到的标注指令对所述视频数据中的第N帧图像进行标注，得到第N帧标注信息，其中，N为正整数；
将所述第N帧图像、所述第N帧标注信息和所述视频数据中的第N+1帧图像输入视频标注模型，得到所述第N+1帧图像的预标注信息，其中，所述视频标注模型根据权利要求1至5中任一项所述的视频标注模型训练方法训练得到；若所述预标注信息不...

【专利技术属性】
技术研发人员：程大治，
申请(专利权)人：江苏黑麦数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人