一种声音识别方法及装置制造方法及图纸

技术编号:16429355 阅读:20 留言:0更新日期:2017-10-22 02:09
本发明专利技术公开了一种声音识别方法,包括:采集声音信号,确定所述声音信号中各脉冲的保持时间;基于所述保持时间计算所述声音信号的频率;将所述声音信号的频率与预设参考频率进行对比,确定所述声音信号的频率与所述预设参考频率之间的相似度,将相似度大于预设阈值且最大的预设参考频率所对应的声音类型确定为采集的声音的类型。本发明专利技术还同时公开了一种声音识别装置。

Method and device for recognizing sound

The invention discloses a voice recognition method, including voice signal acquisition, determine the retention time of each pulse of the voice signal; the holding time calculation of the sound signal based on the frequency; comparing the sound frequency signal with the preset reference frequency, the frequency of the sound signal and the the preset similarity between the reference frequency, determine the type of sound for the collection of the similarity is greater than a preset preset reference frequency threshold and the maximum corresponding to the type of sound. The invention also discloses a voice recognition device.

【技术实现步骤摘要】
一种声音识别方法及装置
本专利技术涉及声音识别技术,尤其涉及一种声音识别方法及装置。
技术介绍
语音识别的研究工作开始于上世纪50年代,贝尔实验室开发出了第一个可以识别十个英文数字的语音识别系统,开启了语音识别的先河。在目前常用的声音识别的方案中,主要是对人类发出的语音进行识别,识别方法主要是利用基于人工智能技术的语音识别技术,对人类发出的语音进行识别,从而通过语音实现人机交互。在生活中,除了人类发出的语音之外,还存在着其它形形色色的声音,例如流水声、炒菜声、敲门声等,人们在做完饭菜后可能会忘记关水龙头或油烟机,将造成资源的浪费;或者,玻璃杯或瓷器掉落地上,碎片未及时处理可能会伤到人。因此,亟需一种可以识别非人类声音的技术方案,从而通过识别此类声音可以进行相应的自动控制或提示。
技术实现思路
针对上述的技术问题,本专利技术实施例期望提供一种声音识别方法及装置,可以识别除人类语音之外的声音。本专利技术的技术方案是这样实现的:本专利技术实施例提供一种声音识别方法,所述方法包括:采集声音信号,确定所述声音信号中各脉冲的保持时间;基于所述保持时间计算所述声音信号的频率;将所述声音信号的频率与预设参考频率进行对比,确定所述声音信号的频率与所述预设参考频率之间的相似度,将相似度大于预设阈值且最大的预设参考频率所对应的声音类型确定为采集的声音的类型。上述方案中,所述将所述声音信号的频率与预设参考频率进行对比之前,所述方法还包括:对所述声音信号的频率进行采样,得到采样频率;将所述采样频率划分为至少一个频段;统计所述至少一个频段中各频段内的频率个数,根据所述频率个数计算各频道内的频率占比,所述频率占比为各频段内的频率个数与采样所得的频率总数之间的比值;所述将所述声音信号的频率与预设参考频率进行对比,确定所述声音信号的频率与所述预设参考频率之间的相似度,包括:将所述至少一个频段中各频段内的所述频率占比分别与所述预设参考频率的参考占比进行对比,得到占比相似度;将所述至少一个频段中各频段内的频率分别与所述预设参考频率进行对比,得到频率相似度;基于所述占比相似度和所述频率相似度获得所述相似度。上述方案中,所述确定所述声音信号中各脉冲的保持时间,包括:确定所述声音信号中信号强度大于预设强度所对应的时间,基于所述时间获得所述声音信号中各脉冲的保持时间。上述方案中,所述基于所述保持时间计算所述声音信号的频率,包括:对所述保持时间求倒数,将所计算的结果作为所述声音信号的频率。上述方案中,所述将所述采样频率划分为至少一个频段,包括:基于频谱识别范围和频谱分辨率将所述采样频率划分为至少一个频段。本专利技术实施例还提供了一种声音识别装置,所述装置包括:采集模块,用于采集声音信号;确定模块,用于确定所述声音信号中各脉冲的保持时间;第一计算模块,用于基于所述保持时间计算所述声音信号的频率;对比模块,用于将所述声音信号的频率与预设参考频率进行对比,确定所述声音信号的频率与所述预设参考频率之间的相似度,将相似度大于预设阈值且最大的预设参考频率所对应的声音类型确定为采集的声音的类型。上述方案中,所述装置还包括:采样模块,用于在对比模块将所述声音信号的频率与预设参考频率进行对比之前,对所述声音信号的频率进行采样,得到采样频率;划分模块,用于将所述采样频率划分为至少一个频段;统计模块,用于统计所述至少一个频段中各频段内的频率个数;第二计算模块,用于根据所述频率个数计算各频道内的频率占比,所述频率占比为各频段内的频率个数与采样所得的频率总数之间的比值;所述对比模块包括:第一对比子模块,用于将所述至少一个频段中各频段内的所述频率占比分别与所述预设参考频率的参考占比进行对比,得到占比相似度;第二对比子模块,用于将所述至少一个频段中各频段内的频率分别与所述预设参考频率进行对比,得到频率相似度;第三计算模块,用于基于所述占比相似度和所述频率相似度获得所述相似度。上述方案中,所述确定模块,具体用于确定所述声音信号中信号强度大于预设强度所对应的时间,基于所述时间获得所述声音信号中各脉冲的保持时间。上述方案中,所述第一计算模块,具体用于对所述保持时间求倒数,将所计算的结果作为所述声音信号的频率。上述方案中,所述划分模块,具体用于基于频谱识别范围和频谱分辨率将所述采样频率划分为至少一个频段。本专利技术实施例提供的声音识别方法及装置,采集声音信号,确定所述声音信号中各脉冲的保持时间;基于所述保持时间计算所述声音信号的频率;将所述声音信号的频率与预设参考频率进行对比,确定所述声音信号的频率与所述预设参考频率之间的相似度,将相似度大于预设阈值且最大的预设参考频率所对应的声音类型确定为采集的声音的类型。可见,本专利技术实施例通过采集声音信号,计算该信号的脉冲保持时间,从而得到相应的频率,将该频率与标准的频率进行对比,从而分辨出该声音的类型。此外,将所述声音信号的频率划分多个频段,按频段分别与标准的频率进行对比,降低了计算量。附图说明图1为本专利技术实施例一公开的一种声音识别方法的实现流程示意图;图2为本专利技术实施例一公开的一种声音识别装置的组成结构示意图;图3为本专利技术实施例二公开的一种声音识别装置的组成结构示意图;图4为本专利技术实施例二公开的一种声音识别方法的实现流程示意图;图5为声音信号的频谱特性随时间的变化示意图;图6为采集到的声音信号与标准特征声音模型之间的相似度随时间变化的示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。实施例一图1为本专利技术实施例公开的一种声音识别方法的实现流程示意图,如图1所示,本实施例的声音识别方法包括以下步骤:步骤101:声音识别装置采集声音信号,确定所述声音信号中各脉冲的保持时间。这里,所述声音包括但不限于:流水声、炒菜声、敲门声、走路声和玻璃或陶器掉地的声音。具体地,当发出流水声、炒菜声、敲门声、走路声或玻璃或陶器掉地的声音这些声音中的任一种时,声音识别装置采集到该声音信号,通过该声音信号的脉冲与时间之间的关系,确定所述声音信号中各脉冲的保持时间。这里,所述保持时间为脉冲从形成到结束的时间。声音识别装置在开启后,将一直采集声音信号,当环境中未发出声音时,采集到信号功率为零;当环境中发出声音时,采集到信号功率大于零。因此,采集到的声音信号在某个时间段内值为零,在另外的某个时间的值大于零;在频谱中,若横坐标为时间,纵坐标为功率或能量,声音信号的纵坐标大于零时,说明采集到的信号出现了有用的声音信号。具体地,确定所述声音信号中各脉冲的保持时间包括:确定所述声音信号中信号强度大于预设强度所对应的时间,基于所述时间获得所述声音信号中各脉冲的保持时间。例如,声音识别装置计算所述声音信号中各脉冲的上升沿和下降沿之间的时间差,将所述时间差确定为所述声音信号中各脉冲的保持时间。例如,当产生了流水声,声音识别装置采集到流水声音信号,假设该流水声音信号的脉冲有a和b两个,脉冲a的上升沿和下降沿对应的时间分别为t1、t2,脉冲b的上升沿和下降沿对应的时间分别为t3、t4,从本文档来自技高网...
一种声音识别方法及装置

【技术保护点】
一种声音识别方法,其特征在于,所述方法包括:采集声音信号,确定所述声音信号中各脉冲的保持时间;基于所述保持时间计算所述声音信号的频率;将所述声音信号的频率与预设参考频率进行对比,确定所述声音信号的频率与所述预设参考频率之间的相似度,将相似度大于预设阈值且最大的预设参考频率所对应的声音类型确定为采集的声音的类型。

【技术特征摘要】
1.一种声音识别方法,其特征在于,所述方法包括:采集声音信号,确定所述声音信号中各脉冲的保持时间;基于所述保持时间计算所述声音信号的频率;将所述声音信号的频率与预设参考频率进行对比,确定所述声音信号的频率与所述预设参考频率之间的相似度,将相似度大于预设阈值且最大的预设参考频率所对应的声音类型确定为采集的声音的类型。2.根据权利要求1所述的方法,其特征在于,所述将所述声音信号的频率与预设参考频率进行对比之前,所述方法还包括:对所述声音信号的频率进行采样,得到采样频率;将所述采样频率划分为至少一个频段;统计所述至少一个频段中各频段内的频率个数,根据所述频率个数计算各频道内的频率占比,所述频率占比为各频段内的频率个数与采样所得的频率总数之间的比值;所述将所述声音信号的频率与预设参考频率进行对比,确定所述声音信号的频率与所述预设参考频率之间的相似度,包括:将所述至少一个频段中各频段内的所述频率占比分别与所述预设参考频率的参考占比进行对比,得到占比相似度;将所述至少一个频段中各频段内的频率分别与所述预设参考频率进行对比,得到频率相似度;基于所述占比相似度和所述频率相似度获得所述相似度。3.根据权利要求1或2所述的方法,其特征在于,所述确定所述声音信号中各脉冲的保持时间,包括:确定所述声音信号中信号强度大于预设强度所对应的时间,基于所述时间获得所述声音信号中各脉冲的保持时间。4.根据权利要求1或2所述的方法,其特征在于,所述基于所述保持时间计算所述声音信号的频率,包括:对所述保持时间求倒数,将所计算的结果作为所述声音信号的频率。5.根据权利要求2所述的方法,其特征在于,所述将所述采样频率划分为至少一个频段,包括:基于频谱识别范围和频谱分辨率将所述采样频率划分为至少一个频段。6.一种声音...

【专利技术属性】
技术研发人员:陈寅之
申请(专利权)人:广东美的厨房电器制造有限公司美的集团股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1