一种音频内容识别方法和装置制造方法及图纸

技术编号：10071706 阅读：173 留言：0更新日期：2014-05-23 17:12

本发明专利技术实施例提供一种音频内容识别方法和装置，包括：预先建立ARAM集，在需要对音频内容进行识别时，针对待识别音频信号中的每个基元，提取MFCC波形特征参数，从而可以利用针对一个基元提取出的MFCC波形特征参数与ARAM集中的ARAM进行模糊匹配，并可以将匹配度最高的ARAM对应的音频内容，确定为该基元对应的音频内容，从而通过与基于MFCC波形特征参数建立的ARAM模型匹配的方式提高识别出的音频内容的准确性。特别的，还可以通过建立特殊音频对应的ARAM，实现对短忙音、长忙音、振铃等特殊音频的准确识别。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术实施例提供一种音频内容识别方法和装置，包括：预先建立ARAM集，在需要对音频内容进行识别时，针对待识别音频信号中的每个基元，提取MFCC波形特征参数，从而可以利用针对一个基元提取出的MFCC波形特征参数与ARAM集中的ARAM进行模糊匹配，并可以将匹配度最高的ARAM对应的音频内容，确定为该基元对应的音频内容，从而通过与基于MFCC波形特征参数建立的ARAM模型匹配的方式提高识别出的音频内容的准确性。特别的，还可以通过建立特殊音频对应的ARAM，实现对短忙音、长忙音、振铃等特殊音频的准确识别。【专利说明】一种音频内容识别方法和装置
本专利技术涉及通信领域，尤其涉及一种音频内容识别方法和装置。
技术介绍
随着通信行业的快速发展，人们对于通信服务的需求越来越大，通信设备的配置也成为当今生活不可缺少的元素，而通信领域的发展也带动了整个社会经济体蓬勃快速的提升。虽然实时通信服务给人们的通信社交生活带来了极大的便利，却也暗藏了一些隐患。近年来越来越多的电信用户受到诸如骚扰电话、电话传销等行为的困扰，更有不法分子通过实时通信网络实施电话诈骗、传播反动言论等威胁人身财产安全的行为，严重影响了广大电信用户的日常生活，同时给电信运营企业、政府监管部门的社会形象与公信力造成了极大的负面影响。如何能够快速准确地甄别出这些音频通信行为并予以精准打击，成为当前通信领域的重要目标。传统的治理手段主要是依靠电信运营企业提供的投诉热线，由电信监管部门采用人工监听等手段来处理上述问题，费时、费力且远远达不到高效率和高精度的监管要求。音频通信在信息检索、公司客服...

【技术保护点】
一种音频内容识别方法，其特征在于，所述方法包括：接收待识别音频信号；对所述待识别音频信号进行切分，确定所述待识别音频信号中的每个基元，一个基元是独立发声的最小区间对应的音频信号；针对每个基元，提取梅尔频率倒谱系数MFCC波形特征参数，根据所述MFCC波形特征参数，与音频识别分析模型ARAM集中每个预先建立的ARAM进行模糊匹配，将匹配度最高的ARAM对应的音频内容，确定为该基元对应的音频内容；其中，所述ARAM是根据MFCC波形特征参数建立的。

【技术特征摘要】

【专利技术属性】
技术研发人员：武勇，周连华，孙怡，张腾，刘焱，
申请(专利权)人：中国移动通信集团上海有限公司，上海中移通信技术工程有限公司，联创亚信科技南京有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人