视频分类方法、设备和介质技术

技术编号：28321897 阅读：11 留言：0更新日期：2021-05-04 13:02

本公开提供了一种视频分类方法、设备和介质，涉及人工智能技术领域，尤其涉及计算机视觉、大数据处理技术领域。实现方案为：对目标视频进行抽帧，以得到多个目标视频帧；将所述多个目标视频帧输入目标分类模型，获取所述目标分类模型输出的所述多个目标视频中每一个目标视频帧的第一类别预测分数，所述第一类别预测分数能够表征所述目标视频帧属于第一视频类别的概率；确定所述第一视频类别相关的第一预设分数阈值和第一预设视频帧数；以及针对所述多个目标视频帧，响应于确定相应的第一类别预测分数不小于所述第一预设分数阈值的一个或多个目标视频帧的数量不小于所述第一预设视频帧数，确定所述目标视频的类别为所述第一视频类别。

全部详细技术资料下载

【技术实现步骤摘要】
视频分类方法、设备和介质
本公开涉及人工智能
，尤其涉及计算机视觉、大数据处理
，具体涉及一种视频分类方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。随着互联网技术飞速发展，短视频的应用场景不断被丰富，海量的短视频被上传至互联网平台，丰富了人们的生活。互联网平台可以对上传的短视频进行分类，以提升推荐效果，进而提升用户体验。在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。
技术实现思路
本公开提供了一种视频分类方法、装置、电子设备、计算机可读存储介质和计算机程序产品。根据本公开的一方面，提供了一种视频分类方法，包括：对目标视频进行抽帧，以得到多个目标视频帧；将所述多个目标视频帧输入目标分类模型，获取所述目标分类模型输出的所述多个目标视频中每一个目标视频帧的第一类别预测分数，所述第一类别预测分数能够表征所述目标视频帧属于第一视...

【技术保护点】
1.一种视频分类方法，包括：/n对目标视频进行抽帧，以得到多个目标视频帧；/n将所述多个目标视频帧输入目标分类模型，获取所述目标分类模型输出的所述多个目标视频中每一个目标视频帧的第一类别预测分数，所述第一类别预测分数能够表征所述目标视频帧属于第一视频类别的概率；/n确定所述第一视频类别相关的第一预设分数阈值和第一预设视频帧数；以及/n针对所述多个目标视频帧，响应于确定相应的第一类别预测分数不小于所述第一预设分数阈值的一个或多个目标视频帧的数量不小于所述第一预设视频帧数，确定所述目标视频的类别为所述第一视频类别。/n

【技术特征摘要】
1.一种视频分类方法，包括：
对目标视频进行抽帧，以得到多个目标视频帧；
将所述多个目标视频帧输入目标分类模型，获取所述目标分类模型输出的所述多个目标视频中每一个目标视频帧的第一类别预测分数，所述第一类别预测分数能够表征所述目标视频帧属于第一视频类别的概率；
确定所述第一视频类别相关的第一预设分数阈值和第一预设视频帧数；以及
针对所述多个目标视频帧，响应于确定相应的第一类别预测分数不小于所述第一预设分数阈值的一个或多个目标视频帧的数量不小于所述第一预设视频帧数，确定所述目标视频的类别为所述第一视频类别。

2.根据权利要求1所述的方法，其中，所述确定第一视频类别相关的第一预设分数阈值和第一预设视频帧数包括：
获取所述第一视频类别的多个正样本视频和多个负样本视频，每一正样本视频包括至少一个正样本帧，每一负样本视频的所有帧均为负样本帧；
对所述多个正样本视频中每一正样本视频进行抽帧，以得到多个正样本视频帧，并且对所述多个负样本视频中每一负样本视频进行抽帧，以得到多个负样本视频帧；
将所述多个正样本视频各自所包括的多个正样本视频帧输入所述目标分类模型，获取所述目标分类模型输出的每一正样本视频帧的第一类别预测分数；
将所述多个负样本视频各自所包括的多个负样本视频帧输入所述目标分类模型，获取所述目标分类模型输出的每一负样本视频帧的第一类别预测分数；以及
基于预设召回率和预设误检率，以及所述多个正样本视频中每一正样本视频帧的第一类别预测分数和所述多个负样本视频中每一负样本视频帧的第一类别预测分数，确定所述第一视频类别相关的第一预设分数阈值和第一预设视频帧数。

3.根据权利要求2所述的方法，其中，基于预设召回率和预设误检率，以及每一正样本视频帧的第一类别预测分数和每一负样本视频帧的第一类别预测分数，确定所述第一视频类别相关的第一预设分数阈值和第一预设视频帧数包括：
设定多个初始分数阈值和多个初始视频帧数；
基于所述多个初始分数阈值中任一初始分数阈值和所述多个初始视频帧数中任一初始视频帧数的组合，以及每一正样本视频帧的第一类别预测分数，确定所述多个正样本视频中属于所述第一视频类别的至少一个正样本视频的召回数量；以及
基于所述召回数量和所述多个正样本视频的总数量，确定所述多个初始分数阈值中任一初始分数阈值和所述多个初始视频帧数中任一初始视频帧数的组合所相应的召回率。

4.根据权利要求3所述的方法，其中，基于预设召回率和预设误检率，以及每一正样本视频帧的第一类别预测分数和每一负样本视频帧的第一类别预测分数，确定所述第一视频类别相关的第一预设分数阈值和第一预设视频帧数还包括：
基于所述多个初始分数阈值中任一初始分数阈值和所述多个初始视频帧数中任一初始视频帧数的组合，以及每一负样本视频帧的第一类别预测分数，确定所述多个负样本视频中属于所述第一视频类别的至少一个负样本视频的误检数量；以及
基于所述误检数量和所述多个负样本视频的总数量，确定所述多个初始分数阈值中任一初始分数阈值和所述多个初始视频帧数中任一初始视频帧数的组合所相应的误检率。

5.根据权利要求4所述的方法，其中，基于预设召回率和预设误检率，以及每一正样本视频帧的第一类别预测分数和每一负样本视频帧的第一类别预测分数，确定所述第一视频类别相关的第一预设分数阈值和第一预设视频帧数还包括：
从所述多个初始分数阈值中任一初始分数阈值和所述多个初始视频帧数中任一初始视频帧数的组合中，确定相应的所述召回率大于所述预设召回率并且相应的所述误检率小于所述预设误检率的至少一个组合；以及
基于所述至少一个组合中每一个组合相应的初始分数阈值和初始视频帧数，确定所述第一视频类别相关的第一预设分数阈值和第一预设视频帧数。

6.根据权利要求3所述的方法，其中，所述多个初始分数阈值为等差数列。

7.根据权利要求3所述的方法，其中，所述一个或多个初始分数阈值的取值区间为[0.2,0.8]。

8.根据权利要求3所述的方法，其中，所述多个初始视频帧数包括1、2、3。

9.根据权利要求1-8中任一项所述的方法，其中，所述目标分类模型的输出还包括所述多个目标视频中每一个目标视频帧的第二类别预测分数，所述第一类别预测分数能够表征所述目标视频帧属于第二视频类别的概率，所述第二视频类别不同于所述第一视频类别，
其中，所述方法还包括：
确定第二视频类别相关的第二预设分数阈值和第二预设视频帧数；
针对所述多个目标视频帧，响应于确定相应的第二类别预测分数不小于所述第二预设分数阈值的一个或多个目标视频帧的数量不小于所述第二预设视频帧数，确定所述目标视频的类别为所述第二视频类别。

10.根据权利要求9所述的方法，其中，所述方法还包括：
响应于确定所述目标视频的类别不为所述第一视频类别和第二视频类别，确定所述目标视频为第三视频类别。

11.根据权利要求1...

【专利技术属性】
技术研发人员：崔东林，王加明，王明凯，于天宝，贠挺，陈国庆，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人