音频的特征提取方法、音频的分类方法和相关装置制造方法及图纸

技术编号：12941108 阅读：86 留言：0更新日期：2016-03-01 11:32

本发明专利技术公开了一种音频的特征提取方法、音频的分类方法和相关装置，用以解决现有技术中无法对不同时长的音频提取出相同长度的特征的问题。该方法包括：获得音频，并针对获得的每个音频执行下述操作：按照预先设置的分帧规则，对该音频进行划分，得到多个音频帧；按照预先设置的特征提取规则，分别对所述多个音频帧进行特征提取，得到各音频帧的特征；根据得到的各音频帧的特征，以及用于区别音频帧类别的各聚类中心，分别确定每个音频帧对应的聚类中心；分别确定各聚类中心所对应的音频帧的个数，并根据确定出的所述个数确定所述音频的特征。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种音频的特征提取方法、音频的分类方法和相关装置，用以解决现有技术中无法对不同时长的音频提取出相同长度的特征的问题。该方法包括：获得音频，并针对获得的每个音频执行下述操作：按照预先设置的分帧规则，对该音频进行划分，得到多个音频帧；按照预先设置的特征提取规则，分别对所述多个音频帧进行特征提取，得到各音频帧的特征；根据得到的各音频帧的特征，以及用于区别音频帧类别的各聚类中心，分别确定每个音频帧对应的聚类中心；分别确定各聚类中心所对应的音频帧的个数，并根据确定出的所述个数确定所述音频的特征。【专利说明】音频的特征提取方法、音频的分类方法和相关装置
本专利技术涉及模式识别领域，尤其涉及一种音频的特征提取方法、音频的分类方法和相关装置。
技术介绍
音频的分类可广泛应用于音频检索以及异常事件检测。比如，应用于音频检索的一个实例是通过对某音频进行语音与音乐的分类，从而能够在确定出的类别所对应的数据库中进行检索。在该实例中，如果能够预先确定出该音频的类别是“音乐”，则可以直接在“音乐数据库”中去检索。特别地，如果能够预先确定出该音频是具备某种音乐风格的音频，则可进一步缩小检索范围。再比如，应用于异常事件检测的一个实例是通过对某音频进行尖叫声、玻璃碎裂声、枪声与正常声音(如按某人正常语速说话的声音等)的分类，从而判断出产生该音频的事件是异常事件还是正常事件。在该实例中，如果确定出该音频的特征与尖叫声、枪声或玻璃碎裂等异常音频的特征类似，则可以确定该音频归属于异常音频这一类别，从而确定该音频所对应的事件为异常事件；而如果该音...
音频的特征提取方法、音频的分类方法和相关装置

【技术保护点】
一种音频的特征提取方法，其特征在于，包括：获得音频，并针对获得的每个音频执行下述操作：按照预先设置的分帧规则，对该音频进行划分，得到多个音频帧；按照预先设置的特征提取规则，分别对所述多个音频帧进行特征提取，得到各音频帧的特征；根据得到的各音频帧的特征，以及用于区别音频帧类别的各聚类中心，分别确定每个音频帧对应的聚类中心；其中，每个音频帧与其对应的聚类中心满足：在该音频帧的特征和每个聚类中心的特征的相似度中，该音频帧的特征和其对应的聚类中心的特征的相似度最大；所述各聚类中心是根据所述分帧规则分别将各个音频样本划分为多个音频样本帧，并按照所述特征提取规则提取各音频样本帧的特征后，对提取出的各音频样本帧的特征进行聚类得到的；分别确定各聚类中心所对应的音频帧的个数，并根据确定出的所述个数确定所述音频的特征。

【技术特征摘要】

【专利技术属性】
技术研发人员：谢志明，潘晖，潘石柱，张兴明，傅利泉，朱江明，吴军，吴坚，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人