声音识别装置以及方法制造方法及图纸

技术编号：3046610 阅读：173 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种具有将所识别的说话声音反馈给使用者的对讲（ｔａｌｋｂａｃｋ）功能的声音识别装置，不必进行繁杂的按钮操作，可以缩短声音识别的操作时间。具有：自适应滤波器４，对模拟了输入声音指令的说话声音以及来自扬声器５２的对讲声音的麦克风５３的位置的传递系统的滤波系数进行设定，滤波处理对讲声音ｘ（ｎ）、由此生成对讲模拟声音ｙ（ｎ）；减法器５，通过将麦克风输入的混杂声音减去对讲模拟声音ｙ（ｎ）来提取说话声音；从说话声音和对讲声音混杂在一起的声音中只衰减掉对讲声音并提供给声音识别引擎５４，这样，就可以不必进行每次说话时都要按下说话按钮而中断对讲的繁杂的操作，在对讲过程中随时可以进行声音输入。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及识别使用者发出的声音指令并进行仪器控制的，特别涉及具有将所识别的说话声音反馈给使用者的对讲(talkback)功能的声音识别装置。
技术介绍
现有，在例如车辆上所搭载的导航装置、免提装置或者个人电子计算机等领域中，通过使用遥控器、触摸屏、键盘或者鼠标以及声音识别装置，使用者可以通过输入声音进行仪器的操作。在这种声音识别装置中，通过按下所配备的说话按钮进入声音识别模式，识别使用者的说话声音执行指令。说话方法主要包括两种。第1种方法为使用者按一下说话按钮则进入声音识别模式，必要时仪器提醒使用者进行声音输入，使用者与仪器之间以对话的方式进行交流的方法。第2种方法为使用者每次按下说话按钮只可以在一定时间里进行声音输入的方法。几乎所有的声音识别装置都具有将所识别的说话声音从扬声器等向使用者反馈的对讲功能。使用者听到对讲声音确认是否正确，如果发现错误就进行声音输入修正，正确的话将命令指示给声音识别装置。声音识别装置通过接受该指示执行各种控制。通常，在声音识别装置中所预备的多个声音指令根据操作内容对控制对象的仪器分成多个层次进行管理。比如，在导航装置中，用地址设定目的地时，按照[都道府县→市区街村→地址以及其它]的形式，将地址分成多个分层进行声音输入。此时，由于在每次进行各分层声音输入时都要进行对讲，因此，在一连串的声音输入完成时大多要花费很长的时间。对此，就有了缩短声音的识别时间的尝试。其中一个例子就是提出了削减对讲的运算量以求达到缩短识别时间的装置(参照例如专利文献1)。日本专利特开平6-149287号公报但是，现有的声音识别装置在进行对讲的中间时...

【技术保护点】
一种声音识别装置（１００），具备识别从麦克风（５３）输入的说话声音并通过扬声器（５２）对讲的功能，其特征在于，包括：自适应滤波器（４），对模拟了从上述扬声器（５２）输出的对讲声音输入到上述麦克风（５３）中的传递系统的滤波系数进行设定、对从上述扬声器（５２）输出之前的对讲声音进行滤波处理，由此生成位于上述麦克风（５３）的对讲模拟声音；　　　　说话声音提取单元（５），从上述麦克风（５３）输入的声音中减去上述对讲模拟声音，由此提取说话声音。

【技术特征摘要】
JP 2003-5-2 2003-1273781.一种声音识别装置(100)，具备识别从麦克风(53)输入的说话声音并通过扬声器(52)对讲的功能，其特征在于，包括自适应滤波器(4)，对模拟了从上述扬声器(52)输出的对讲声音输入到上述麦克风(53)中的传递系统的滤波系数进行设定、对从上述扬声器(52)输出之前的对讲声音进行滤波处理，由此生成位于上述麦克风(53)的对讲模拟声音；说话声音提取单元(5)，从上述麦克风(53)输入的声音中减去上述对讲模拟声音，由此提取说话声音。2.如权利要求1所述的声音识别装置(100)，其特征在于，包括清晰度改善处理单元(1，2)，使用上述自适应滤波器(4)生成的上述对讲模拟声音和从上述麦克风(53)输入的声音中减去上述对讲模拟声音以后的声音，进行从上述扬声器(52)输出之前的对讲声音的清晰度改善处理。3.如权利要求1所述的声音识别装置(100)，其特征在于，还包括第2扬声器(62-1、62-2)；第2自适应滤波器(7-1，7-2)，对模拟了从上述第2扬声器(62-1、62-2)输出的音频音输入到上述麦克风(53)中去的传递系统的第2滤波系数进行设定，对从上述第2扬声器(62-1、62-2)输出之前的音频音进行滤波处理，由此生成位于上述麦克风(53)生成音频模拟音；说话声音提取单元(9)，将从上述麦克风(53)经由说话声音提取单元(5)输入的声音减去上述音频模拟音，由此提取说话声音。4.如权利要求3所述的声音识别装置(200)，其特征在于，设置了将音频音相加的加法器(11)，上述第2扬声器(62-1、62-2)中的至少一个扬声器(62-1)用上述加法器(11)进行音频音的相加。5.如权利要求4所述的声音识别装置(300)，其特征在于，上述第2自适应滤波器(7-1，7-2)中的至少一个自适应滤波器(7-1)，对模拟了上述扬声器(62-1)输出的对讲声音和音频音的混合声音输入到上述麦克风(53)中的传递系统的滤波系数进行设定，对从上述扬声器(62-1)输出之前的混合声音进行滤波处理，由此生成位于上述麦克风(53)的混合模拟声音。6.如权利要求4所述的声音识别装置(300)，其特征在于，上述第2自适应滤波器(7-1，7-2)中的另一个自适应滤波器(7-2)，对模拟了上述多个扬声器(62-1，62-2)中的另一个扬声器(62-2)输出的另一个声道的音频音输入到上述麦克风(53)中的传递系统的第2滤波系数进行设定，对从上述另一个扬声器(62-2)输出之前的音频音进行滤波处理，由此生成位于上述麦克风(53)的音频模拟音。7.如权利要求6所述的声音识别装置(300)，其特征在于，还包括可变滤波器(10)，复制上述自适应滤波器(7-1)设定的滤波系数并进行设定，对从上述至一个扬声器(62-1)输出之前的对讲声音进行滤波处理，由此生成位于上述麦克风(53)的对讲模拟声音。8.一种声音识别方法，其特征在于，包括以下步骤当识...

【专利技术属性】
技术研发人员：松本修一，丸本彻，
申请(专利权)人：阿尔派株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人