一种基于深度卷积神经网络的体育视频镜头分类方法技术

技术编号：13732640 阅读：58 留言：0更新日期：2016-09-21 14:23

本发明专利技术公开了一种基于深度卷积神经网络的体育视频镜头分类方法，包括以下步骤：1)对已有足球视频进行镜头分割，每个镜头是由某个摄像头拍摄的一段连续的图像序列，从每个镜头片段中选出3～10张的关键帧图像，并对每张图像贴上镜头类别标签，构造训练样本集；2)构造七层深度卷积神经网络，该七层卷积神经网路包括：五个卷积层，三个全连接层；3)利用步骤1)中的训练样本对步骤2)中所述深度卷积神经网络模型进行训练，卷积神经网络的训练利用softmax回归作为分类算法，使用误差后向传播算法调整CNN的网络参数；4)利用步骤3)训练得到的卷积神经网络模型对测试样本集进行测试，并输出最终图像的镜头分类结果。

全部详细技术资料下载

【技术实现步骤摘要】

：本专利技术属于视频处理与机器学习领域，具体涉及一种基于深度卷积神经网络的体育视频镜头分类方法。
技术介绍
：镜头分类是体育视频分析的一项基础技术，对于体育视频中特定事件检测、体育视频的检索和高级语义的提取都具有重要的意义，例如足球视频分析中特定事件的检测(红黄牌、射门、比赛中断等)和特定球员的检测都需要用到镜头分类的结果。一个准确快速的镜头分类方法对于后续分析性能的提高将产生极大的帮助。在体育比赛的转播视频中，通常可以将镜头分为三类：远景镜头、中景镜头和特写镜头。远景镜头拍摄的是大部分场地，中景镜头是对场地中局部区域的某些球员和场景进行拍摄，特写镜头是对运动员的半身特写或动作信息。其中的中景镜头和特写镜头除了对场地进行拍摄外，还包括对场外观众的拍摄。当前区分以上几类镜头的方法主要是通过计算主颜色区域的面积比率。这类方法将镜头中场地的颜色确定为主颜色(如足球场地以绿色为主颜色)，然后再根据主颜色在镜头中占据的面积比率来判断该镜头所属的类别，并认为拥有较大的主颜色面积比率的镜头是远景镜头，而较小的主颜色面积比率的镜头是特写镜头。由于该方法所用主颜色面积比率特征在中景镜头和特写镜头中受到背景颜色干扰较大，限制了最终的镜头分类精度。
技术实现思路
：为了克服现有技术的不足，本专利技术提供一种基于深度卷积神经网络的体育视频镜头分类的方法。本专利技术通过深度卷积神经网络，学习数据库中每类镜头的图像特征，在测试时直接选取卷积神经网络softmax层最大回归值对应的类别作为镜头分类的结果，使对于给出的关键帧能自动进行所属镜头的分类。本专利技术能够提高镜头分类的精度，且具有...

【技术保护点】
一种基于深度卷积神经网络的体育视频镜头分类方法，其特征在于，包括以下步骤：1)对已有足球视频进行镜头分割，每个镜头是由某个摄像头拍摄的一段连续的图像序列，从每个镜头片段中选出3～10张的关键帧图像，并对每张图像贴上镜头类别标签，构造训练样本集；2)构造七层深度卷积神经网络，该七层卷积神经网路包括：五个卷积层，三个全连接层；3)利用步骤1)中的训练样本对步骤2)中所述深度卷积神经网络模型进行训练，卷积神经网络的训练利用softmax回归作为分类算法，使用误差后向传播算法调整CNN的网络参数；4)利用步骤3)训练得到的卷积神经网络模型对测试样本集进行测试，并输出最终图像的镜头分类结果。

【技术特征摘要】
1.一种基于深度卷积神经网络的体育视频镜头分类方法，其特征在于，包括以下步骤：1)对已有足球视频进行镜头分割，每个镜头是由某个摄像头拍摄的一段连续的图像序列，从每个镜头片段中选出3～10张的关键帧图像，并对每张图像贴上镜头类别标签，构造训练样本集；2)构造七层深度卷积神经网络，该七层卷积神经网路包括：五个卷积层，三个全连接层；3)利用步骤1)中的训练样本对步骤2)中所述深度卷积神经网络模型进行训练，卷积神经网络的训练利用softmax回归作为分类算法，使用误差后向传播算法调整CNN的网络参数；4)利用步骤3)训练得到的卷积神经网络模型对测试样本集进行测试，并输出最终图像的镜头分类结果。2.根据权利要求1所述的一种基于深度卷积神经网络的体育视频镜头分类方法，其特征在于，所...

【专利技术属性】
技术研发人员：王进军，张顺，刘桢琦，
申请(专利权)人：西安北升信息科技有限公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人