【技术实现步骤摘要】
本专利技术涉及音频信号分析,更具体地讲,涉及仅从音频信号自动提取体 育节目精彩片断。
技术介绍
近来,随着音频信号分析技术的发展,可将与体育节目相关的多媒体内 容自动分析并总结为精彩片断。传统上,编辑精彩片断是人们的工作。但是,随着多媒体互联网和广播的发展,用户可通过数字TV、互联网广播、移动网 络等访问大量多媒体内容。因此,如果内容被自动分析并总结为精彩片断, 则可作为帮助用户发现他们想要欣赏的内容的索引。在多媒体内容分析领域中,存在大量关于体育节目精彩片断的提取和总 纟吉的文献, <列i口 , B丄i, M.I.Sezan, Semantic Sports Video Analysis: Approaches and New Applications, in Proc. of IEEE International Conference on Image Processing, vo.l, pp 17-20, 2003; M.Yeung, B.Yeo, B丄iu, Extracting Story Units from Long Programs for ...
【技术保护点】
一种用于检测冲击声的设备,所述设备包括: 激励检测单元,确定音频信号中的激励候选的位置,以用于指示音频信号中冲击声的存在和位置; 时频特征化单元,将从激励检测单元输出的每一激励候选附近的频谱内容压缩为时频域的特征矩阵;和 冲击声检验单元,基于从时频特征化单元输出的特征矩阵,使用统计假设检验方法确定激励候选是否由特定运动动作引起,并输出由所述特定运动动作引起的激励的位置。
【技术特征摘要】
1、一种用于检测冲击声的设备,所述设备包括激励检测单元,确定音频信号中的激励候选的位置,以用于指示音频信号中冲击声的存在和位置;时频特征化单元,将从激励检测单元输出的每一激励候选附近的频谱内容压缩为时频域的特征矩阵;和冲击声检验单元,基于从时频特征化单元输出的特征矩阵,使用统计假设检验方法确定激励候选是否由特定运动动作引起,并输出由所述特定运动动作引起的激励的位置。2、 如权利要求l所述的设备,其中,所述激励检测单元包括 计算单元,计算音频信号的子带能量增量比率、对数能量和对数能量变化量;激励滤波单元,使用2阶滤波器对计算单元计算的信号的轨迹进行滤波; 激励候选确定单元,确定经激励滤波的轨迹中的每一个都高于其特定阈值的激励候选的位置;和;险测单元,使用冲击激励应该遵循的特定约束筛除不是合格的冲击激励的激励候选,以确定属于冲击激励的激励候选的位置。3、 如权利要求2所述的设备,其中,沖击激励应该遵循的特定约束包括(1) 能量峰值具有不低于特定阈值的绝对强度和相对强度;(2) 能量增加速率高于特定阈值;(3) 以新形式出现;和(4) 从峰值迅速衰减。4、 如权利要求l所述的设备,其中,特征矩阵是4x4系数矩阵,所述系 数指示激励候选在时间上的4段在4个子带中的平均幅度谱。5、 一种用于声音分类的设备,所述设备包括特征提取单元,从音频信号提取声学特征,声学特征包括18阶Mel频 率倒谱系数及其前四阶差分系数和第 一阶加速系数;声音分类单元,根据音频信号的声学特征,通过使用具有多种高斯密度 的贝叶斯分类器识别音频信号所属的声音类别;和内容分段单元,基于不同音频内容的占有率,在时间上重新划分声音分 类单元识别出的不同声音类别的不同音频内容。6、 如权利要求5所述的设备,其中,占有率是一个音频内容在一个持续 时间中占有的百分比,占有率如下计算,R (*) =D (*) /W (*),其中,*表示一个音频内容,W (*)是M^则音频内容的时间窗的持续时 间,D (*)是该音频内容在该时间窗内的持续时间。7、 如权利要求6所述的设备,其中,内容分段单元基于不同音频内容的 占有率来执行内容搜索算法以确定不同音频内容的位置和持续时间,从而重 新划分不同的音频内容。8、 如权利要求7所述的设备,其中,内容搜索算法是折半搜索算法。9、 一种从音频信号自动提取体育节目精彩片断的设备,所述设备包括 用于检测冲击声的模块,其确定在音频信号中由特定运动动作引起的冲击激励的位置;用于声音分类的模块,其识别音频信号所属的声音类别并重新划分不同 声音类别的不同音频内容;和精彩片断提取单元,在时间上将冲击激励的位置和重新划分的音频内容 结合,并且如果存在与特定运动动作相应的特定音频内容,则确定由所述特 定运动动作和所述特定音频内容组成的精彩片断。10、 如权利要求9所述的设备,其中,精彩片断提取单元根据所述特定 音频内容的持续时间将精彩片断的等级分等。11、 如权利要求IO所述的设备,其中,所述特定运动动作是击球动作。12、 如权利要求IO所述的设备,其中,所述特定音频内容是鼓掌。13、 如权利要求9所述的设备,其中,用于检测冲击声的模块包括 激励检测单元,确定音频信号中的激励候选的位置,以用于指示音频信号中冲击声的存在和位置;时频特征化单元,将从激励检测单元输出的每一激励候选附近的频谱内 容压缩为时频域的特4i矩阵;和冲击声检验单元,基于从时频特征化单元输出的特征矩阵,使用统计假 设检验方法确定激励候选是否由特定运动动作引起,并输出由所述特定运动 动作引起的激励的位置。14、 如权利要求13所述的设备,其中,所述激励检测单元包括 计算单元,计算音频信号的子带能量增量比率、对数能量和对数能量变 化量;激励滤波单元,使用2阶滤波器对计算单元计算的信号的轨迹进行滤波;激励候选确定单元,确定经激励滤波的轨迹中的每一个都高于其特定阈值的激励候选的位置;和检测单元,使用冲击激励应该遵循的特定约束筛除不是合格的冲击激励 的激励候选,以确定属于冲击激励的激励候选的位置。15、 如权利要求14所述的设备,其中,冲击激励应该遵循的特定约束包括(1) 能量峰值具有不低于特定阈值的绝对强度和相对强度;(2) 能量增加速率高于特定阔值;(3) 以新形式出现;和(4) 从峰值迅速衰减。16、 如权利要求13所述的设备,其中,特征矩阵是4x4系数矩阵,所述 系数指示激励候选在时间上的4段在4个子带中的平均幅度谱。17、 如权利要求9所述的设备,其中,用于声音分类的模块包括 特征提取单元,从音频信号提取声学特征,声学特征包括18阶Mel频率倒i普系数及其前四阶差分系数和第 一 阶加速系数;声音分类单元,根据音频信号的声学特征,通过使用具有多种高斯密度 的贝叶斯分类器识别音频信号所属的声音类别;和内容分段单元,基于不同音频内容的占有率,在时间上重新划分声音分 类单元识别出的不同声音类别的不同音频内容。18、 如权利要求17所述的设备,其中,占有率是一个音频内容在一个持 续时间中占有的百分比,占有率如下计算,R(*) =D(*)/W(*),其中,*表示一个音频内容,W (*)是观测音频内容的时间窗的持续时 间,D (*)是该音频内容在该时间窗内的持续时间。19、 如权利要求18所述的设备,其中,内容分段单元基于不同音频内容 的占有率来执行内容搜索算法以确定不同音频内容的位置和持续时间,从...
【专利技术属性】
技术研发人员:史媛媛,朱璇,邓菁,
申请(专利权)人:三星电子株式会社,北京三星通信技术研究有限公司,
类型:发明
国别省市:KR[韩国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。