语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备制造方法及图纸

技术编号:18292738 阅读:98 留言:0更新日期:2018-06-24 08:54
本发明专利技术提供了一种语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备,涉及智能穿戴设备技术领域。其中,语音控制优化方法包括:接收音频信号,在音频信号进入语音识别系统(ASR)之前,对音频信号进行声学滤波,获取预处理音频;预处理音频被麦克风采集,经过模拟电路滤波后通过模数转换生成数字音频;数字音频经由语音识别系统(ASR)被处理为有效语音指令;根据有效语音指令触发智能设备的相应功能。本发明专利技术针对入耳麦克风的应用场景,提出一系列优化方法,有效抑制噪声成分,从而得到较纯净的语音数据,然后推送给相关的后端服务模块,以保障高质量服务的提供。

【技术实现步骤摘要】
语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备
本专利技术涉及智能穿戴设备
,具体而言,涉及一种语音控制优化方法和装置,一种集成入耳式麦克风的耳机和一种穿戴设备。
技术介绍
听与说,是人所具有的交流沟通的基本属性。相应的,智能穿戴设备也需要基本的交流沟通能力,能够说,也能够听。智能穿戴设备的听说能力,借由两种输入输出的声学传感器来完成。前者,通过麦克风输入传感器来采集声音;后者,通过扬声器输出传感器来播放声音。通过普通麦克风采集到的声音,一般来说不会只包含一种单纯的声音,而是人声,音乐声,以及各种各样的环境音(噪音)的混合体。而智能穿戴设备所提供的诸多服务(语音唤醒,语音识别,语音通话,音乐播放等)的完成,往往只依赖于混合声音的人声部分,而且是设备佩戴者的人声,除此之外的环境音,非佩戴者的语音以及其它噪声成分的存在,反而会阻碍某些服务的正常运行。因此,智能穿戴设备,需要一个声学前端子系统,来完成对外界声音的采集和相关处理,最大程度的提供有效的音频数据,以保证后端各种功能服务模块的正常运行。
技术实现思路
本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。提出了一种语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备来完成对外界声音的采集和相关处理,最大程度的提供有效的音频数据,以保证后端各种功能服务模块的正常运行。为此,本专利技术的一个目的在于提出了一种语音控制优化方法。本专利技术的另一个目的在于对应提供了一种语音控制优化装置。本专利技术的再一个目的在于提供了一种集成入耳式麦克风的耳机。本专利技术的再一个目的在于提供了一种穿戴设备。为实现上述目的,本专利技术的第一方面提供了一种语音控制优化方法,通过语音识别系统(ASR)处理收音装置采集到的声音信号得到指令信号,根据所述指令信号实现对智能设备的语音控制,包括:接收音频信号,在所述音频信号进入所述语音识别系统(ASR)之前,对所述音频信号进行声学滤波,获取预处理音频;所述预处理音频被麦克风采集,经过模拟电路滤波后通过模数转换生成数字音频;所述数字音频经由语音识别系统(ASR)被处理为有效语音指令;根据所述有效语音指令触发智能设备的相应功能。优选的是,所述声学滤波是通过机械机构和/或声学结构对空间域的声音信号进行降噪处理。在上述任一方案中优选的是,所述数字音频被语音识别系统(ASR)处理为有效语音指令,具体包括:通过DSP模块的耳道适配算法、去混响算法和噪音抑制算法处理所述数字音频,输出处理后的数字信号至所述语音识别系统(ASR),所述语音识别系统(ASR)将接收到的数字信号转化为文本信息,所述文本信息通过自然语言处理系统(NLP)被处理为所述有效语音指令。在上述任一方案中优选的是,所述麦克风为骨传导麦克风和/或入耳式麦克风。在上述任一方案中优选的是,根据声学结构的系统传递函数对所述预处理音频信号进行滤波整形,所述声学结构的系统传递函数由亥姆霍兹谐振的中心频率fc确定:其中,其中c是空气速度,AH是声孔的横截面积,LH是声孔的长度,VC是空腔的容积。在上述任一方案中优选的是,所述经过模拟电路滤波后通过模数转换生成数字音频,具体包括:根据模拟滤波电路的系统传递函数进行所述滤波。在上述任一方案中优选的是,在所述数字音频经由语音识别系统(ASR)被处理为有效语音指令之前,还包括:根据数字滤波器的系统传递函数对所述数字音频进行数字滤波。在上述任一方案中优选的是,所述耳道适配算法具体包括:根据测量佩戴者朗读固定语音序列的频谱响应得到耳道系统相对于声学麦克风系统的传递函对所述数字音频进行耳道适应校准。本专利技术的第二部分涉及一种语音控制优化装置,通过语音识别系统(ASR)处理收音装置采集到的声音信号得到指令信号,根据所述指令信号实现对智能设备的语音控制,其特征在于,包括:声学滤波单元,接收音频信号,在所述音频信号进入所述语音识别系统(ASR)之前,对所述音频信号进行声学滤波,获取预处理音频;模数转换单元,所述预处理音频被麦克风采集,经过模拟电路滤波后通过模数转换生成数字音频;语音识别单元,所述数字音频经由语音识别系统(ASR)被处理为有效语音指令;执行指令单元,根据所述有效语音指令触发智能设备的相应功能。优选的是,所述声学滤波是通过机械机构和/或声学结构对空间域的声音信号进行降噪处理。在上述任一方案中优选的是,所述语音识别单元,具体包括:数字处理子单元,通过DSP模块的耳道适配算法、去混响算法和噪音抑制算法处理所述数字音频,输出处理后的数字信号至所述语音识别系统(ASR),文本转换子单元,所述语音识别系统(ASR)将接收到的数字信号转化为文本信息,指令生成单元,所述文本信息通过自然语言处理系统(NLP)被处理为所述有效语音指令。在上述任一方案中优选的是,所述麦克风为骨传导麦克风和/或入耳式麦克风。在上述任一方案中优选的是,还包括:整形滤波单元,根据声学结构的系统传递函数对所述预处理音频信号进行滤波整形,所述声学结构的系统传递函数由亥姆霍兹谐振的中心频率fc确定:其中,其中c是空气速度,AH是声孔的横截面积,LH是声孔的长度,VC是空腔的容积。在上述任一方案中优选的是,所述模数转换单元,具体包括:模拟滤波子单元,根据模拟滤波电路的系统传递函数进行所述滤波。在上述任一方案中优选的是,还包括:数字滤波子单元,根据数字滤波器的系统传递函数对所述数字音频进行数字滤波。在上述任一方案中优选的是,所述耳道适配算法具体包括:根据测量佩戴者朗读固定语音序列的频谱响应得到耳道系统相对于声学麦克风系统的传递函对所述数字音频进行耳道适应校准。本专利技术的第三部分涉及一种集成入耳式麦克风的耳机,包括壳体、模拟音频处理模块和数字音频处理模块,还包括:上述任一项所述的语音控制优化装置;以及声学处理模块,作为所述模拟音频处理模块的前置处理模块,根据机械机构和/或声学结构进行声学滤波;耳内收音管,连接至所述声学处理模块以及所述模拟音频处理模块,设置在所述壳体内部,位于耳道内进行声波收集。本专利技术的第四方面涉及一种穿戴设备,包括:如上述技术方案所述的集成入耳式麦克风的耳机。本专利技术取得的有益效果是:通过对空间域的声学模块、模拟域的电路模块、数字域的DSP模块的相关算法的协同处理,完成对有效声音要素的滤波/整形/抑噪处理,提取出佩戴者的人声,滤除环境音和非佩戴者的语音以及其它噪声成分,提高了智能设备对语音指令的识别率。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为按照本专利技术的语音控制优化方法的一优选实施例的流程图;图2为按照本专利技术的语音控制优化装置的一优选实施例的示意框图;图3为按照本专利技术的集成入耳式麦克风的耳机的一优选实施例的示意框图;图4为按照本专利技术的一种穿戴设备的一优选实施例的示意框图;图5为按照本专利技术穿戴设备的一优选实施例的硬件系统示意图;图6为按照本专利技术的语音控制优化方法的一优选实施例的信号处理流程示意图。具体实施方式为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施方式对本专利技术进行进一步的详细描述。需要说本文档来自技高网...
语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备

【技术保护点】
1.一种语音控制优化方法,通过语音识别系统(ASR)处理收音装置采集到的声音信号得到指令信号,根据所述指令信号实现对智能设备的语音控制,其特征在于,包括:接收音频信号,在所述音频信号进入所述语音识别系统(ASR)之前,对所述音频信号进行声学滤波,获取预处理音频;所述预处理音频被麦克风采集,经过模拟电路滤波后通过模数转换生成数字音频;所述数字音频经由语音识别系统(ASR)被处理为有效语音指令;根据所述有效语音指令触发智能设备的相应功能。

【技术特征摘要】
2017.07.12 CN 201710566244X1.一种语音控制优化方法,通过语音识别系统(ASR)处理收音装置采集到的声音信号得到指令信号,根据所述指令信号实现对智能设备的语音控制,其特征在于,包括:接收音频信号,在所述音频信号进入所述语音识别系统(ASR)之前,对所述音频信号进行声学滤波,获取预处理音频;所述预处理音频被麦克风采集,经过模拟电路滤波后通过模数转换生成数字音频;所述数字音频经由语音识别系统(ASR)被处理为有效语音指令;根据所述有效语音指令触发智能设备的相应功能。2.根据权利要求1所述的语音控制优化方法,其特征在于,所述声学滤波是通过机械机构和/或声学结构对空间域的声音信号进行降噪处理。3.根据权利要求1所述的语音控制优化方法,其特征在于,所述数字音频被语音识别系统(ASR)处理为有效语音指令,具体包括:通过DSP模块的耳道适配算法、去混响算法和噪音抑制算法处理所述数字音频,输出处理后的数字信号至所述语音识别系统(ASR),所述语音识别系统(ASR)将接收到的数字信号转化为文本信息,所述文本信息通过自然语言处理系统(NLP)被处理为所述有效语音指令。4.根据权利要求1所述的语音控制优化方法,其特征在于,所述麦克风为骨传导麦克风和/或入耳式麦克风。5.根据权利要求4所述的语音控制优化方法,其特征在于,还包括:根据声学结构的系统传递函数对所述预处理音频信号进行滤波整形,所述声学结构的系统传递函数由亥姆霍兹谐振的中心频率fc确定:其中,其中c是空气...

【专利技术属性】
技术研发人员:雒利滨艾智慕陈鑫武巍朱华明
申请(专利权)人:北京金锐德路科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1