语音辨识制造技术

技术编号：16935059 阅读：23 留言：0更新日期：2018-01-03 05:28

本申请公开一种光学麦克风布置，其包括：衬底(8)上的光学麦克风(4)的阵列，所述光学麦克风(4)中的每一个提供指示由于传入可听声音引起的相应薄膜(24)的位移的信号；第一处理器(12)，其被布置成从所述光学麦克风(4)接收所述信号且对所述信号执行第一处理步骤以产生第一输出；以及第二处理器(14)，其被布置成接收所述信号或所述第一输出中的至少一个；其中至少所述第二处理器(14)从所述可听声音确定人类语音的至少一个元素的存在。

Speech recognition

The invention discloses an optical microphone arrangement, comprising: a substrate (8) on the optical microphone (4) of the array, the optical microphone (4) provided in each indicator film due to the corresponding incoming audible sound caused by the displacement signal (24); the first processor (12), which is arranged from the optical microphone (4) receives the signal and the signal processing steps performed first to generate a first output; and a second processor (14), which is arranged to receive the signal or the first output of at least one; wherein at least the second processor (14) determines at least one element of human speech from the audible sounds.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】语音辨识
本专利技术涉及用于语音辨识的某些布置。
技术介绍
用于机器理解自然人类语音的能力是长期目标。近年来已经做出较大的进步，但这仍然是困难的且计算上密集的任务。确切地说，虽然移动装置上的语音辨识助理的使用已增加，但这些通常需要远程实行处理；当前使用大多数移动装置上本地可用的处理能力可能只能实行最基本形式的语音辨识。增加语音辨识问题的复杂性的一个因素是背景噪声。典型移动装置中使用的麦克风是相对全向的，且因此将对来自所有方向的声音敏感(即使不均匀)。所述麦克风因此往往拾取背景声音(将常常包含来自他人的语音)以及需要理解的语音。虽然可使用多个麦克风实现较好性能，但是这带来在装置中容纳额外硬件的实际问题。然而常规小型电容式麦克风受到它们经受的固有‘自’噪声量的限制。电容式麦克风是基于电容改变的测量。物理约束(例如薄膜在高声学压力下的最大位移)使得电容的两个板(板中的一个是麦克风薄膜，另一个是位于所述薄膜下方的参考电极)之间必须具有某一距离。这暗示电容是极低的，换句话说输出阻抗是高的。为了不使此电容短路，相关联前置放大器的输入阻抗必须同等地高。高阻抗将产生高自噪声。较大薄膜将带来较高信号电平和较高电容，且因此带来较好的信噪比(SNR)而非电平，而较小面积将带来较低SNR。
技术实现思路
本专利技术在其若干方面中希望提供在至少一些环境中有益于解决人工语音辨识面临的挑战的布置。当从第一方面来看时，本专利技术提供一种光学麦克风布置，其包括：衬底上的光学麦克风的阵列，所述光学麦克风中的每一个提供指示由于传入可听声音引起的相应薄膜的位移的信号；第一处理器，其被布置成从所述光学...
语音辨识

【技术保护点】
一种光学麦克风布置，其包括：衬底上的光学麦克风的阵列，所述光学麦克风中的每一个提供指示由于传入可听声音引起的相应薄膜的位移的信号；第一处理器，其被布置成从所述光学麦克风接收所述信号且对所述信号执行第一处理步骤以产生第一输出；以及第二处理器，其被布置成接收所述信号或所述第一输出中的至少一个；其中至少所述第二处理器从所述可听声音确定人类语音的至少一个元素的存在。

【技术特征摘要】
【国外来华专利技术】2015.04.09 GB 1506046.01.一种光学麦克风布置，其包括：衬底上的光学麦克风的阵列，所述光学麦克风中的每一个提供指示由于传入可听声音引起的相应薄膜的位移的信号；第一处理器，其被布置成从所述光学麦克风接收所述信号且对所述信号执行第一处理步骤以产生第一输出；以及第二处理器，其被布置成接收所述信号或所述第一输出中的至少一个；其中至少所述第二处理器从所述可听声音确定人类语音的至少一个元素的存在。2.根据权利要求1所述的光学麦克风布置，其中所述光学麦克风布置于小于5mm的相互间距处。3.根据权利要求1或2所述的光学麦克风布置，其中所述第一和第二处理器中的至少一个被布置成：对所述信号执行多个处理操作，其中所述处理操作对应于所述信号从相应多个方向放射而给出多个候选者确定的多个假设；以及随后基于选择准则而选择所述候选者假设中的一个。4.根据权利要求1或2所述的光学麦克风布置，其中所述第一处理器被布置成从所述可听声音确定人类语音的至少一个元素的存在，且如果确定所述元素存在，那么发出唤醒信号以致使所述第二处理器从相对被动模式改变为较主动模式。5.根据任一前述权利要求所述的光学麦克风布置，其中所述第一处理器和所述光学麦克风阵列提供于共同装置中。6.根据任一前述权利要求所述的光学麦克风布置，其中所述第二处理器远离其中提供所述光学麦克风阵列的一装置或所述装置而提供。7.根据任一前述权利要求所述的光学麦克风布置，其中所述第一处理器被布置成实行初始信号处理以辅助所述第二处理器中的语音辨识。8.根据权利要求1到6中任一权利要求所述的光学麦克风布置，其中所述第一处理器被布置成对所述信号实行波束成形，且所述第二处理器被布置成实行语音辨识。9.根据任一前述权利要求所述的光学麦克风布置，其中所述第二处理器被布置成至少使用基频以及作为所述基频的整数倍数的泛音频率从所述可听声音确定人类语音的至少一个元素的存在。10.根据权利要求9所述的光学麦克风布置，其被布置成使用多个泛音。11.根据权利要求9或10所述的光学麦克风布置，其中所述光学麦克风具有小于所述基频的二分之一波长的相互间距。12.根据权利要求9、10或11所述的光学麦克风布置，其被布置成在所述泛音的频率实行波束成形。13.根据权利要求12所述的光学麦克风布置，其中所述波束成形由所述第一处理器实行。14.一种光学麦克风布置，其包括：衬底上的光学麦克风的阵列，所述光学麦克风具有小于5mm的相互最接近间距，所述光学麦克风中的每一个提供指示由于传入可听声音引起的相应薄膜的位移的信号；一个或多个处理器，其被布置成从所述光学麦克风接收所述信号且从所述可听声音确定人类语音...

【专利技术属性】
技术研发人员：托拜厄斯·达尔，马修·拉科勒，
申请(专利权)人：挪威科技工业研究院TTO股份公司，
类型：发明
国别省市：挪威,NO

全部详细技术资料下载我是这个专利的主人