【技术实现步骤摘要】
一种无需数字特征提取计算的声音分类方法
本专利技术属于语音
,具体涉及一种声音分类的方法。
技术介绍
声音分类是用来区分声音类别的方法。声音分类任务和语音识别任务不同,例如区分婴儿哭声和正常环境声这样的声音分类任务对于特征向量的要求一般低于语音识别。语音识别任务一般需要提取语音中的共振峰特征,所以需要用到梅尔频率倒谱系数或者线性感知预测等高级特征,这些特征都需要从数字音频信号中提取,提取的过程需要大量的数字运算,会涉及快速傅里叶变换、三角函数计算、指数计算和对数计算,一般情况按照每10毫秒处理一帧数据。而对于这类声音分类任务来说,按照频段的能量特征向量就可以满足声音分类的训练和使用要求。例如区分婴儿哭声和正常环境声的声音分类任务,由于婴儿哭声在特定的频段能量特征明显,和环境噪声在频谱上差异较大,所以按照多个频段提取的能量是特征向量。在声音分类方法中,特征的提取一般是在数字域进行,首先将麦克风采集的模拟信号经过模数转换(A/D)转为数字信号,然后对数字信号提取声音的特征。提取声音的特征之后,将声音特征和声音模型进行比对计 ...
【技术保护点】
1.一种无需数字特征提取计算的声音分类方法,其特征在于,包括如下步骤:/n步骤一、通过录音系统获取模拟录音信号,然后通过模拟电路组成的模拟滤波器组得到N个频段的模拟信号,N为特征向量所要求的频段数量;/n步骤二、对步骤一中生成的N个频段的模拟信号分别处理进行能量计算;/n步骤三、通过模数转换器,将每个频段的模拟能量特征转换为数字能量特征;/n步骤四、将各频段的数字能量特征与模型数据进行匹配计算,获取声音的类别。/n
【技术特征摘要】
1.一种无需数字特征提取计算的声音分类方法,其特征在于,包括如下步骤:
步骤一、通过录音系统获取模拟录音信号,然后通过模拟电路组成的模拟滤波器组得到N个频段的模拟信号,N为特征向量所要求的频段数量;
步骤二、对步骤一中生成的N个频段的模拟信号分别处理进行能量计算;
步骤三、通过模数转换器,...
【专利技术属性】
技术研发人员:陈盛,马文亮,
申请(专利权)人:爱荔枝科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。