【技术实现步骤摘要】
本专利技术涉及数据分析,例如声音数据索引和分类。更具体地说,本专利技术涉及为了多种应用(例如基于内容的音乐检索和基于网络的在线音乐分销)而为数字音乐原始数据自动制作摘要。
技术介绍
电脑网络和多媒体技术的突飞猛进使得数字多媒体数据集的规模飞速增长。为适应发展,有需要为大量的多媒体数据集制作简明而富信息的摘要,而该摘要应该能在大规模信息组织和处理中最好地收集原本内容里的重要元素。迄今为止,自动建立文字、语音和视像摘要的技术已经提出过很多,并且在不断发展中。然而,音乐摘要的制作指的是确定某一音乐最通俗显著的主旋律部分以代表该音乐且让听众易于识别。因为原始的数字音乐数据是没有特征的位元组,所以音乐摘要的制作与文字、语音和视像摘要的制作相比,是个特别的难题,也因此音乐摘要的制作仅限于高度无固定结构的单一性声音文件的形式。2001年5月1日公告授予国际商用机器公司(IBM公司)的6,225,546号美国专利涉及音乐摘要的制作,其披露了用于乐器设计界面(MIDI)数据格式的摘要制作系统,该系统利用MIDI乐曲的反复性特征自动识别某一乐曲的主旋律部分。探测引擎利用算法并处理 ...
【技术保护点】
数字声音数据摘要制作方法,包括以下步骤:分析声音数据,从而确定声音数据的表示法,该声音数据具有至少一个计算出的能够体现声音数据特点的特征;根据表示法将声音数据分入至少两种类别中的一种;以及生成能代表数字声音数据摘要的 声信号,其中摘要制作取决于所挑选的类别。
【技术特征摘要】
1.数字声音数据摘要制作方法,包括以下步骤分析声音数据,从而确定声音数据的表示法,该声音数据具有至少一个计算出的能够体现声音数据特点的特征;根据表示法将声音数据分入至少两种类别中的一种;以及生成能代表数字声音数据摘要的声信号,其中摘要制作取决于所挑选的类别。2.如权利要求1所述的方法,其特征在于分析步骤还包括将声音数据分割成帧,并将帧叠加。3.如权利要求2所述的方法,其特征在于分类步骤还包括通过从各帧收集训练数据以及通过利用训练计算确定分类参数,将帧分类。4.如前述任一权利要求所述的方法,其特征在于计算出的特征包括与音乐内容相关的感知特征和主观特征。5.如权利要求3所述的方法,其特征在于训练计算包括统计学的学习算法,其中统计学的学习算法是隐藏式马尔可夫模型、神经网络或支持向量机。6.如前述任一权利要求所述的方法,其特征在于声信号的种类为音乐。7.如前述任一权利要求所述的方法,其特征在于声信号的种类为声乐或纯音乐。8.如前述任一权利要求所述的方法,其特征在于计算出的特征是振幅包络、功率频谱或梅尔频率倒频谱系数。9.如前述任一权利要求所述的方法,其特征在于根据与纯音乐或声乐相关的集群结果和启发式规则生成摘要。10.如前述任一权利要求所述的方法,其特征在于计算出的特征是与纯音乐内容或声乐内容有关的线性预测系数、零交叉率或梅尔频率倒频谱系数。11.用于为数字声音数据制作摘要的设备,包括特征提取器,该特征提取器用于接收声音数据并分析该声音数据从而确定声音数据表示法,所述声音数据具有至少一个计算出的能够体现声音数据特点的特征;分类器,该分类器与特征提取器联系,用作根据来自特征提取器的表示法将声音数据分入至少两种类别中的一种;以及摘要器,该摘要器和分类器联系,用作生成能代表数字声音数据摘要的声信号,其中摘要制作取决于所挑选的类别。12.如权利要求11所述的设备,还包括与特征提取器联系的分割器,该分割器接收声音文件,以及将声音数据分割成帧,并为特征提取器叠加帧的分割器。13.如权利要求12所述的设备,还包括和分类器联系的分类参数发生器,其中分类器通过从各帧收集训练数据并通过利用在分类参数发生器中的训练计算确定分类参数,将每一帧分类。14.如权利要求11-13中任一权利要求所述的设备,其特征在于计算出的特征包括与音乐内容相关的感知特征和主观特征。15.如权利要求11-14中任一权利要求所述的设备,其特征在于训练计算包括统计学的学习算法,其中统计学的学习算法是隐藏式马尔可夫模型、神经网络或支持向量机。1...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。