基于音频特征的歌曲智能识别方法技术

技术编号：7084302 阅读：396 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了一种基于音频特征的歌曲智能识别方法，其包括以下步骤：(1)服务器对歌曲建立音频特征库；(2)在客户端设置好采样率，对外界歌曲进行录音t秒时间以上；(3)然后采用特定的音频特征提取算法提取该段音频的特征值；(4)处理完毕后，将音频特征参数通过网络上传到服务器；(5)在接受到待匹配的特征值后开始采用匹配算法进行相似度匹配；(6)匹配成功则将歌曲的原信息如歌曲名称、歌手、专辑名称等发送到客户端；匹配失败则反馈匹配失败的信息。本发明专利技术的目的在于设计出一种高性能高识别率的歌曲识别方案，实现起来比较灵活又具有良好的模块化和可扩展性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及歌曲或乐曲的识别。
技术介绍
传统的音频特征常用来识别字、词、说话人和场景识别，比如(1)连续语音识别系统，把输入的语流切分为小的片段，在识别前先把各字分开，识别单词之间的边界。整个识别系统分为三层声学-语音层、词层和句法层。采用隐式马尔可夫模型框架，将各层次组成一个统一的结构。(2)基于内容的音频检索，通过反复重复一个歌曲的曲调，可以将歌曲的曲调片段从一系列音频信号中检索出来。(3)嵌入式语音识别系统在嵌入式平台实现的特定人孤立词语音识别系统。特定人语音识别系统可以对孤立词汇进行声学建模，识别采用动态时间归整等匹配算法，对小词汇量识别实现效果比较理想。尽管传统音频特征可以被用来识别字词和语句曲调，但在用来识别歌曲音乐的时候，也存在一些问题或缺陷例如利用连续语音识别系统进行歌曲识别。由于歌词速度不固定，时快时慢，对歌曲内容进行分割建立单词之间的边界是非常困难的。尽管有时可以采用能量最低点作为边界，但通常还要根据发音信息加以验证。利用Mel频率倒谱系数为特征以及一个树形结构的分类器进行分类的方法，可以实现对音乐和声音的检索，但该方法对音乐和环境声音分类效果不够好。另外目前在嵌入式平台实现的主要是对系统的运算资源和存储资源要求比较低的特定人孤立词语音识别系统。综上，现有音频特征识别系统实现方案主要针对说话语音语义进行识别，在歌曲识别方面要么不能进行有效的识别，要么带有一些局限性。本专利技术的目的在于设计出一种高性能高识别率的歌曲识别方案，实现起来比较灵活又具有良好的模块化和可扩展性。
技术实现思路
为了解决现有技术中问题，本专利技术提供了一种，...

【技术保护点】
１．一种基于音频特征的歌曲智能识别方法，其特征在于：其包括以下步骤：（１）服务器对歌曲建立音频特征库；（２）在客户端设置好采样率，对外界歌曲进行录音ｔ秒时间以上；（３）然后采用特定的音频特征提取算法提取该段音频的特征值；（４）处理完毕后，将音频特征参数通过网络上传到服务器；（５）在接受到待匹配的特征值后开始采用匹配算法进行相似度匹配；（６）匹配成功则将歌曲的原信息如歌曲名称、歌手、专辑名称等发送到客户端；匹配失败则反馈匹配失败的信息。

【技术特征摘要】

【专利技术属性】
技术研发人员：张钦宇，林威，梁玉锋，李云鹤，卜磊，潘振鹏，
申请(专利权)人：哈尔滨工业大学深圳研究生院，
类型：发明
国别省市：94

全部详细技术资料下载我是这个专利的主人