去相关稀疏映射音乐流派有监督自动分类方法技术

技术编号：6083715 阅读：257 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及音频信号处理。为提供一种能够提高音乐流派自动分类准确率，方便音乐音频数据库内容组织和检索，也可用于其它基于内容音乐信息检索，提高检索性能的基于最小一范数稀疏映射的音乐流派有监督自动分类方法及系统，本发明专利技术采用的技术方案是，基于去相关稀疏映射音乐流派有监督自动分类方法，包括下列步骤：a建立有监督训练数据库；b对训练音乐样本提取短时音乐特征和节奏特征，短时音乐特征即MFCC和音色特征；c对提取的特征数据采用PCA(主分量分析)技术去噪和降维；d将特征矩阵按流派类别分块；e确定y的种类为argmini||y-Aδi(x)i||2，i＝1，2，...，k，δ(x)的非零值为第i类。本发明专利技术主要应用于音频信号处理。

Supervised sparse classification, music genre, supervised automatic classification method

The present invention relates to audio signal processing. In order to provide a kind of automatic music genre can improve the classification accuracy, easy music audio database content organization and retrieval, can also be used for other content based music information retrieval and improve the retrieval performance of a minimum norm sparse mapping of the music genre based on the supervised classification method and system, the technical scheme of the invention is based on the decorrelation sparse mapping music genre automatic classification methods, including the following steps: establishing a supervised training database; B feature extraction of short-term characteristics of music and rhythm on the training of music samples, short music features MFCC and timbre characteristics; feature data extraction of C by PCA (principal component analysis) technique for denoising and dimensionality reduction; d the characteristic matrix according to the genre category block; e y argmini||y-A to determine the types of delta I (x) i||2, I = 1, 2,..., K, 8 (x) of the non-zero value for class I . The invention is mainly applied to audio signal processing.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频信号处理，具体讲涉及去相关稀疏映射音乐流派有监督自动分类方法。
技术介绍
当今数字化与网络时代化，数据存储技术和多媒体压缩技术如JPEG、MPEG等技术的快速发展，导致数字多媒体数据的存储量增加，也导致互联网上音频数据的增加。目前，图像、音频和视频等多媒体内容已成为互联网信息高速公路上所传送数据的主要部分，而音乐又是音频的主要部分，随着互联网的发展，越来越多的人能够更加方便、快捷、经济地接触到数字音乐，人们面临的问题不再是缺少媒体内容，而是如何在浩如烟海的多媒体世界中找到自己所需要的信息。音乐流派是人类创造的用于区分和描述音乐，然而由于历史和文化等原因音乐流派没有严格的定义与界限，每一种音乐流派的特征都是由其成员的特征决定的，这些特征又是由乐器，节奏和音乐的和声决定的。目前音乐流派的分类是靠人工完成的，当面对网络上海量的音乐时，人工分类不足以完成如此巨大的工作量，这时需要借助计算机、人工智能等以取代人工分类，实现音乐流派的自动分类。目前，在现有的基于音乐内容的专利中，大多是基于音乐内容的音乐检索。2009年 4月1日公布的、公开号为CN101398825、名称为用于快速音乐分类和检索的方法和设备的中国专利技术专利申请公布说明书提供了一种基于内容的音乐分类方法，该专利提取短时音乐特征，即MFCC和音质特征，采用基于支持向量机(SVM)进行分类。近年来，基于最小一范数稀疏映射已经成功应用于模式识别与分类，在医学领域癌症与肿瘤的分类、人脸识别、卫星图像分类、说话人识别和种子分类方面取得了较好的分类效果。目前未发现基...

【技术保护点】
１．一种基于去相关稀疏映射音乐流派有监督自动分类方法，其特征是，包括下列步骤：ａ建立有监督训练数据库；ｂ对训练音乐样本提取短时音乐特征和节奏特征，短时音乐特征即ＭＦＣＣ和音色特征；ｃ对提取的特征数据采用ＰＣＡ（主分量分析）技术去噪和降维；ｄ将特征矩阵按流派类别分块，则Ａ＝［Ａ１，Ａ２，．．．，ＡＫ］为特征矩阵，Ｋ为音乐流派种类的个数，ｙ为测试样本，求出方程ｙ＝Ａｘ的最小一范数解。ｅ确定ｙ的种类为ａｒｇ　ｍｉｎｉ｜｜ｙ－Ａδｉ（ｘ）ｉ｜｜２，ｉ＝１，２，．．．，ｋ，δ（ｘ）的非零值为第ｉ类。

【技术特征摘要】

【专利技术属性】
技术研发人员：关欣，徐星，李锵，
申请(专利权)人：天津大学，
类型：发明
国别省市：12

全部详细技术资料下载我是这个专利的主人