一种自动分割和分类体育视频镜头的方法和装置制造方法及图纸

技术编号：3584850 阅读：179 留言：0更新日期：2012-04-11 18:40

本发明专利技术提出一种体育视频镜头自动分割和分类的方法。该方法将体育视频流分成连续的镜头采样单元（ＳＳＵ），则不同的镜头对应于不同的ＳＳＵ时序序列，用隐马尔可夫模型为不同的ＳＳＵ序列建模，就得到不同镜头的隐马尔可夫模型。在此基础上，将所有可能的镜头模型组合串接起来就形成了镜头网络。对于镜头网络中的每条路径即一个镜头模型序列，计算其ｌｏｇ概率，将概率最大的作为最佳路径，则该最佳路径上的所有镜头模型即为最终的分类结果，而相应的ＳＳＵ序列的起始和终止ＳＳＵ即为镜头的边界，从而实现了对体育视频镜头的分割。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频镜头分割方法及其装置，特别是涉及一种对于体育视频镜头自动分割和分类的方法和装置。技术背景在体育视频中，镜头是体育视频的基本结构单元，体育视频镜头通常指的是由单一相机视角拍摄所形成一组连续的图像帧。不同类型的体育视频镜头表现了不同的语义内容，如远景镜头通常反映的是比赛的全局情况，而中景镜头通常是对比赛队员的动作跟踪，而特写镜头通常是对队员和裁判的近距离特写，一般出现在比赛的暂停阶段。体育视频的镜头分割可以采用一般视频的分割方法，通过相邻帧的相似程度得到镜头的边界，但是现有方法没有考虑体育视频镜头的特殊性，即运动快，结构具有重复性等特点，因此镜头分割结果并不准确。对于体育视频镜头分类，现有的一些方法主要采用领域知识和特定的规则，如根据草色比例和人员大小对足球视频镜头分割和分类，这些方法能够对特定的体育视频取得很好的效果，但是不具有通用性，不用的体育视频要根据各自的特点推导出不同的分类规则。另一方面，体育视频的类型众多，但是大致可以分成远景、中景和特写三种镜头类型。体育视频镜头分割和分类的目的就是从体育视频中将这三类镜头分割出来并标注其镜头类型，从而为体育视频建立结构化的索引。但是鉴于不同的体育视频的镜头具有不同的表现形式，要求所选取的镜头特征既能代表不同镜头类型的特点，又具有通用性以便能够适用在不同的体育视频上。
技术实现思路
本专利技术的目的是提供一种通用的体育视频镜头分割和分类方法，能够自动的对体育视频镜头进行分割和分类，从而为体育视频建立结构索引，进一步的用于体育视频的语义内容分析。为此，本专利技...

【技术保护点】
一种体育视频镜头自动分割和分类的方法，包括下列步骤：１）将一个镜头分成多个镜头采样单元ＳＳＵ的序列；２）根据每个ＳＳＵ中的视频帧计算每个ＳＳＵ的颜色相关特征和运动相关特征；３）根据ＨＭＭ镜头模型通过镜头网络计算每个镜头模型的对数概率；４）选取对数概率之和最大的模型序列，其中，该序列中的各个模型的状态序列与相应的ＳＳＵ序列对应。

【技术特征摘要】
1. 一种体育视频镜头自动分割和分类的方法，包括下列步骤1)将一个镜头分成多个镜头采样单元SSU的序列；2)根据每个SSU中的视频帧计算每个SSU的颜色相关特征和运动相关特征；3)根据HMM镜头模型通过镜头网络计算每个镜头模型的对数概率；4)选取对数概率之和最大的模型序列，其中，该序列中的各个模型的状态序列与相应的SSU序列对应。2、根据权利要求l的方法，其中每个SSU的颜色相关特征和运动相关特征是该SSU内所有图象帧的相应特征的平均。3、根据权利要求2的方法，其中每个图像帧的颜色相关特征包括了 L、 U 和V分量，即三个基本颜色特征Z^ CZ,，运动相关特征包括帧差运动信息IV，运动补偿帧差CV和宏块的运动强度M,，它们是分别利用下列公式计算的<formula>formula see original document page 2</formula>其中x,力，t/(x,力，r(x,力为(JC，力点像素的L， U， V分量； D/ = (H(/， 0 — — L !'))2 /帧/中的像素数目其中表示第/帧中颜色为/的像素数目；其中5f(:c，力为位置在(;c，力点的宏土央，d(w',v')为前一帧中最匹配的宏块，而(7, 为第/帧中所有小块的数目。P^为每个小块的大小； M S [(x-7+(.)2]1/2其中(',v')即为与^(:c,力最匹配的块0'，v')在帧/-l中的位置。4、根据权利要求3的方法，其中每个图像帧的颜色相关特征还包括了上述颜色相关特征的1阶差分信息<table>table see original document page 3</column></row><table>和上述运动相关特征的1阶差分信息5、根据权利要求4的方法，其中每个图像帧的颜色相关特征还包括了上述颜色相关特征的2阶差分信息<formula>formula see original document page 3</formula>和上述运动相关特征的2阶差分信息6、根据权利要求l一5的方法，其中上述镜头网络是通过将所有可能的镜头模型组合序列连接起来形成的。7、根据权利要求1一6之一的方法，其中HMM镜头模型是利用上述颜色相关特征和运动相关特征作为训练数据进行训练后得到的镜头模型。8、根据权利要求1一7之一的方法，其中HMM镜头模型包括远景、中景和特写镜头模型。9、根据权利要求1一8的方法，其中SSU可以分成相互重叠。10、根据权利要求9的方法，其中每个SSU设为25帧，采样间隔是10帧。11、一种体育视频镜头自...

【专利技术属性】
技术研发人员：杨颖，林守勋，张勇东，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人