训练方法、识别方法、装置、电子设备以及存储介质制造方法及图纸

技术编号：30693124 阅读：13 留言：0更新日期：2021-11-06 09:27

本公开公开了视频识别模型的训练方法、视频识别方法、装置、电子设备、存储介质以及程序产品。涉及人工智能技术领域，尤其涉及计算机视觉和直播技术领域。具体实现方案为：获取训练样本，其中，训练样本包括视频数据和与视频数据相对应的标签，视频数据包括与交通场景相关的视频数据，标签指示了在采集视频数据的同时发生的事件；以及利用训练样本训练初始视频识别模型，得到视频识别模型。得到视频识别模型。得到视频识别模型。

全部详细技术资料下载

【技术实现步骤摘要】
训练方法、识别方法、装置、电子设备以及存储介质

[0001]本公开涉及人工智能
，尤其涉及计算机视觉和直播
具体涉及视频识别模型的训练方法、视频识别方法、装置、电子设备、存储介质以及程序产品。

技术介绍

[0002]随着网络上视频数据数量呈现爆炸式增长，海量的数据源以及丰富的数据层次，使得依靠人工来分析和处理这些视频数据变得越来越困难。计算机视觉技术为解放人力提供巨大潜力。计算机视觉是一门研究如何使用电子设备“看”的科学，即，利用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等的科学技术。计算机视觉技术为公共安全、信息安全、金融安全层面的应用发展提供巨大帮助。

技术实现思路

[0003]本公开提供了一种视频识别模型的训练方法、视频识别方法、装置、电子设备、存储介质以及程序产品。
[0004]根据本公开的一方面，提供了一种视频识别模型的训练方法，包括：获取训练样本，其中，训练样本包括视频数据和与视频数据相对应的标签，视频数据包括与交通场景相关的视频数据，标签指示了在采集视频数据的同时发生的事件；以及利用训练样本训练初始视频识别模型，得到视频识别模型。
[0005]根据本公开的另一方面，提供了一种视频识别方法，包括：获取待识别视频数据；以及将待识别视频数据输入视频识别模型，得到与待识别视频数据相对应的识别结果；其中，视频识别模型是利用如上所述的视频识别模型的训练方法训练的。
[0006]根据本公开的另一方面，提供了一种视频识别模型的训练装置，包括：样本获取模块，用于获...

【技术保护点】

【技术特征摘要】
1.一种视频识别模型的训练方法，包括：获取训练样本，其中，所述训练样本包括视频数据和与所述视频数据相对应的标签，所述视频数据包括与交通场景相关的视频数据，所述标签指示了在采集所述视频数据的同时发生的事件；以及利用所述训练样本训练初始视频识别模型，得到所述视频识别模型。2.根据权利要求1所述的方法，其中，所述视频数据包括以下至少一项：与车辆相关的视频数据、与道路相关的视频数据、与交通设施相关的视频数据、对象视频数据。3.根据权利要求2所述的方法，其中，所述与车辆相关的视频数据包括以下至少一项：车辆车身视频数据、车辆内仓视频数据；其中，所述与道路相关的数据包括以下至少一项：道路交通标志线视频数据、道路路面视频数据、绿化带视频数据、道路两侧场景视频数据；其中，所述与交通设施相关的视频数据包括以下至少一项：交通信号灯视频数据、违章信息采集设备视频数据、交通岗亭视频数据、道路交通指示牌视频数据。4.根据权利要求1所述的方法，其中，所述标签包括表示了在采集所述视频数据的同时发生驾驶事件的第一类别标签和表示了在采集所述视频数据的同时未发生驾驶事件的第二类别标签。5.根据权利要求1至4任一项所述的方法，其中，所述利用所述训练样本训练初始视频识别模型，得到所述视频识别模型包括：提取所述视频数据中的多个视频帧；标记所述多个视频帧各自的时序信息，得到多个目标视频帧；以及利用所述多个目标视频帧和与所述视频数据相对应的标签训练所述初始视频识别模型，得到所述视频识别模型。6.根据权利要求5所述的方法，其中，所述提取所述视频数据中的多个视频帧包括：按照预设抽帧频率等间隔提取所述视频数据中的多个视频帧。7.根据权利要求5所述的方法，其中，所述提取所述视频数据中的多个视频帧还包括：确定所述视频数据的时长；在确定所述视频数据的时长大于预设时长的情况下，切分所述视频数据，得到多个视频段数据，以便从所述多个视频段数据的每个视频段数据中提取所述多个视频帧。8.根据权利要求5所述的方法，其中，所述标记所述多个视频帧各自的时序信息，获得多个目标视频帧包括：按照所述视频数据的时序正序标记所述多个视频帧各自的时序信息，得到所述多个目标视频帧；或者按照所述视频数据的时序倒序标记所述多个视频帧各自的时序信息，得到所述多个目标视频帧。9.一种视频识别方法，包括：获取待识别视频数据；以及将所述待识别视频数据输入视频识别模型，得到与所述待识别视频数据相对应的识别结果；
其中，所述视频识别模型是利用根据权利要求1
‑
8中任一项所述的方法训练的。10.根据权利要求9所述的方法，其中，所述将所述待识别视频数据输入视频识别模型，得到与所述待识别视频数据相对应的识别结果包括：提取所述待识别视频数据中的多个待识别视频帧；标记所述多个待识别视频帧各自的时序信息，得到多个目标待识别视频帧；以及将所述多个目标待识别视频帧输入所述视频识别模型，得到与所述待识别视频数据相对应的识别结果。11.根据权利要求9所述的方法，其中，所述获取待识别视频数据包括：确定正在直播中的直播间标识信息；以及基于所述直播间标识信息，获取所述直播间的与当前时间最接近的已经直播过的视频数据，并将所述直播间的与当前时间最接近的已经直播过的视频数据作为所述待识别视频数据。12.一种视频识别模型的训练装置，包括：样本获取模块，用于获取训练...

【专利技术属性】
技术研发人员：孙想，邓天生，贠挺，于天宝，陈国庆，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人