特定声音识别方法、设备和存储介质技术

技术编号:18610444 阅读:22 留言:0更新日期:2018-08-04 23:02
一种特定声音识别方法、设备和存储介质,所述方法包括:采样声音信号并获取所述声音信号的梅尔频率倒谱系数特征参数矩阵(201);从所述声音信号的梅尔频率倒谱系数特征参数矩阵中提取信号特征(202);确认所述信号特征是否匹配预先获取的基于支持向量数据描述算法的特定声音特征模型(203);如果匹配,则确认所述声音信号为特定声音(204)。上述特定声音识别方法、设备和存储介质,采用基于MFCC特征参数和SVDD模型的识别算法对特定声音进行识别,能适用于各种不同的特定声音,算法复杂度低,且计算量少、对硬件要求低,降低了产品制造成本。

【技术实现步骤摘要】
【国外来华专利技术】特定声音识别方法、设备和存储介质
本申请实施例涉及声音处理技术,尤其涉及一种特定声音识别方法、设备和存储介质。
技术介绍
在生活中,我们每天都可以听到一些特定的、没有实际语义的声音。如:哭声、鼾声、咳嗽声、呼吸声、笑声、鞭炮声等等,尽管它们没有实际的语义,但是却能够准确的反应人们的生理需求、状态或者物质的品质。例如:父母可以通过婴儿的哭声信号辨别婴儿的饱或饿状态,医生能够通过病人的鼾声、咳嗽、呼吸等等辨别人们的健康情况,人们通过鞭炮声音的大小或者次数来判断鞭炮的质量情况。这类特定声音内容比较简单、重复,却是我们生活中不可或缺的一部分,有效的识别和判断各种特定声音信号意义重大。目前有研究通过语音识别技术识别特定声音。例如有针对咳嗽声音的识别方法,将咳嗽声音的特性和语音识别技术相结合,建立咳嗽模型,采用基于动态时间规整算法(DynamicTimeWarping,DTW)的模型匹配方法对特定人的孤立咳嗽声音进行识别。有针对婴儿哭声的语音识别算法,语音特征参数使用目前最广泛采用的MFCC参数,使用最大欧氏距离划分初始样本,使用LBG算法不断迭代优化得到最终码本。在婴儿哭声的识别阶段,提取待识别语音的MFCC特征参数与已有码本计算矢量量化误差,若矢量量化误差两次低于判断值,输出判别为婴儿哭声的结果。实现本申请过程中,专利技术人发现相关技术中至少存在如下问题:现有的识别算法,计算量大、对硬件设备要求高。且不同的特定声音需要采用不同的算法,无法使用统一的算法进行识别,算法复杂。
技术实现思路
本申请的目的在于提供一种特定声音识别方法、设备和存储介质,能采用统一的算法识别各种特定声音,算法简单,且计算量小,对硬件设备要求低。为实现上述目的,第一方面,本申请实施例提供了一种特定声音识别方法,用于识别设备,所述方法包括:采集声音信号并获取所述声音信号的梅尔频率倒谱系数特征参数矩阵;从所述声音信号的梅尔频率倒谱系数特征参数矩阵中提取信号特征;确认所述信号特征是否匹配预先获取的基于支持向量数据描述算法的特定声音特征模型;如果匹配,则确认所述声音信号为所述特定声音。可选的,所述方法还包括:预先获取所述基于支持向量数据描述算法的特定声音特征模型。可选的,所述预先获取所述基于支持向量数据描述算法的特定声音特征模型,包括:采集预设数量的特定声音样本信号并获取所述特定声音样本信号的梅尔频率倒谱系数特征参数矩阵;从所述特定声音样本信号的梅尔频率倒谱系数特征参数矩阵中提取所述信号特征;将所述特定声音样本信号的信号特征作为输入,训练支持向量数据描述算法模型,以获取所述基于支持向量数据描述算法的特定声音特征模型。可选的,所述特定声音包括咳嗽声、鼾声、呼吸声、笑声、鞭炮声和哭声中的任意一种。可选的,所述信号特征包括能量特征、局部特征、全局频域特征和过零率特征中的一种或多种子信号特征。可选的,所述基于支持向量数据描述算法的特定声音特征模型包括基于支持向量数据描述算法的能量特征模型,基于支持向量数据描述算法的局部特征模型,基于支持向量数据描述算法的全局频域特征模型和基于支持向量数据描述算法的过零率特征模型中的一种或多种基于支持向量数据描述算法的子特征模型;若所述基于支持向量数据描述算法的特定声音特征模型包括多种基于支持向量数据描述算法的子特征模型,所述确认所述信号特征是否匹配预先获取的基于支持向量数据描述算法的特征模型,包括:分别确认所述信号特征中的各个子信号特征是否均匹配预先获取的所述多种基于支持向量数据描述算法的子特征模型。第二方面,本申请实施例提供了一种特定声音识别设备,所述特定声音识别设备包括:声音输入单元,用于接收声音信号;信号处理单元,用于对所述声音信号进行模拟信号处理;所述信号处理单元与特定声音识别设备内置或者外置的运算处理单元相连,所述运算处理单元包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行:采集声音信号并获取所述声音信号的梅尔频率倒谱系数特征参数矩阵;从所述声音信号的梅尔频率倒谱系数特征参数矩阵中提取信号特征;确认所述信号特征是否匹配预先获取的基于支持向量数据描述算法的特定声音特征模型;如果匹配,则确认所述声音信号为所述特定声音。可选的,所述至少一个处理器还能够执行:预先获取所述基于支持向量数据描述算法的特定声音特征模型。可选的,所述预先获取所述基于支持向量数据描述算法的特定声音特征模型,包括:采集预设数量的特定声音样本信号并获取所述特定声音样本信号的梅尔频率倒谱系数特征参数矩阵;从所述特定声音样本信号的梅尔频率倒谱系数特征参数矩阵中提取所述信号特征;将所述特定声音样本信号的信号特征作为输入,训练支持向量数据描述算法模型,以获取所述基于支持向量数据描述算法的特定声音特征模型。可选的,所述特定声音包括咳嗽声、鼾声、呼吸声、笑声、鞭炮声和哭声中的任意一种。可选的,所述信号特征包括能量特征、局部特征、全局频域特征和过零率特征中的一种或多种子信号特征。可选的,所述基于支持向量数据描述算法的特定声音特征模型包括基于支持向量数据描述算法的能量特征模型,基于支持向量数据描述算法的局部特征模型,基于支持向量数据描述算法的全局频域特征模型和基于支持向量数据描述算法的过零率特征模型中的一种或多种基于支持向量数据描述算法的子特征模型;若所述基于支持向量数据描述算法的特定声音特征模型包括多种基于支持向量数据描述算法的子特征模型,所述确认所述信号特征是否匹配预先获取的基于支持向量数据描述算法的特定声音特征模型,包括:分别确认所述信号特征中的各个子信号特征是否均匹配预先获取的所述多种基于支持向量数据描述算法的子特征模型。第三方面,本申请实施例还提供了一种存储介质,所述存储介质存储有可执行指令,所述可执行指令被特定声音识别设备执行时,使所述特定声音识别设备执行上述的方法第四方面,本申请实施例还提供了一种程序产品,所述程序产品包括存储在存储介质上的程序,所述程序包括程序指令,当所述程序指令被特定声音识别设备执行时,使所述特定声音识别设备执行上述的方法。本申请实施例提供的特定声音识别方法、设备和存储介质,采用基于MFCC特征参数和SVDD模型的识别算法对特定声音进行识别,能适用于各种不同的特定声音,算法复杂度低,且计算量少、对硬件要求低,降低了产品制造成本。附图说明一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。图1是本申请各实施例的应用环境的结构示意图;图2是咳嗽声音信号的时间-幅度图;图3是咳嗽声音信号的时间-频率图;图4是MFCC系数计算过程中梅尔频率滤波处理示意图;图5是本申请实施例提供的特定声音识别方法中预先获得基于支持向量数据描述算法的特定声音特征模型的流程示意图;图6是本申请实施例提供的特定声音识别方法的流程示意图;图7是本申请实施例提供的特定声音识别装置的结构示意图;图8是本申请实施例提供的特定声音识别设备的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和本文档来自技高网...

【技术保护点】
1.一种特定声音识别方法,其特征在于,所述方法包括:采集声音信号并获取所述声音信号的梅尔频率倒谱系数特征参数矩阵;从所述声音信号的梅尔频率倒谱系数特征参数矩阵中提取信号特征;确认所述信号特征是否匹配预先获取的基于支持向量数据描述算法的特定声音特征模型;如果匹配,则确认所述声音信号为所述特定声音。

【技术特征摘要】
【国外来华专利技术】1.一种特定声音识别方法,其特征在于,所述方法包括:采集声音信号并获取所述声音信号的梅尔频率倒谱系数特征参数矩阵;从所述声音信号的梅尔频率倒谱系数特征参数矩阵中提取信号特征;确认所述信号特征是否匹配预先获取的基于支持向量数据描述算法的特定声音特征模型;如果匹配,则确认所述声音信号为所述特定声音。2.根据权利要求1所述的特定声音识别方法,其特征在于,所述方法还包括:预先获取所述基于支持向量数据描述算法的特定声音特征模型。3.根据权利要求2所述的特定声音识别方法,其特征在于,所述预先获取所述基于支持向量数据描述算法的特定声音特征模型,包括:采集预设数量的特定声音样本信号并获取所述特定声音样本信号的梅尔频率倒谱系数特征参数矩阵;从所述特定声音样本信号的梅尔频率倒谱系数特征参数矩阵中提取所述信号特征;将所述特定声音样本信号的信号特征作为输入,训练支持向量数据描述算法模型,以获取所述基于支持向量数据描述算法的特定声音特征模型。4.根据权利要求1-3任意一项所述的特定声音识别方法,其特征在于,所述特定声音包括咳嗽声、鼾声、呼吸声、笑声、鞭炮声和哭声中的任意一种。5.根据权利要求1-3任意一项所述的特定声音识别方法,其特征在于,所述信号特征包括能量特征、局部特征、全局频域特征和过零率特征中的一种或多种子信号特征。6.根据权利要求5所述的特定声音识别方法,其特征在于,所述基于支持向量数据描述算法的特定声音特征模型包括基于支持向量数据描述算法的能量特征模型,基于支持向量数据描述算法的局部特征模型,基于支持向量数据描述算法的全局频域特征模型和基于支持向量数据描述算法的过零率特征模型中的一种或多种基于支持向量数据描述算法的子特征模型;若所述基于支持向量数据描述算法的特定声音特征模型包括多种基于支持向量数据描述算法的子特征模型,所述确认所述信号特征是否匹配预先获取的基于支持向量数据描述算法的特征模型,包括:分别确认所述信号特征中的各个子信号特征是否均匹配预先获取的所述多种基于支持向量数据描述算法的子特征模型。7.一种特定声音识别设备,其特征在于,所述特定声音识别设备包括:声音输入单元,用于接收声音信号;信号处理单元,用于对所述声音信号进行模拟信号处理;所述信号处理单元与特定声音识别设备内置或者外置的运算处理单元相连,所述运算处理单元包括:至少一个处理器;以及,与所述至少一个处理器通...

【专利技术属性】
技术研发人员:刘洪涛冯澍婷欧朋
申请(专利权)人:深圳和而泰智能家居科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1