System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及听力装置如助听器,尤其涉及听力装置的话音控制。本专利技术还涉及包括发射器的听力装置。
技术介绍
1、目前正广泛部署用于控制多个不同设备的话音控制接口。这些接口中的许多接口在用户说唤醒词(或句子)及随后说命令词或句子时开启。例子包括所谓的虚拟助理如siri、alexa、(google)assistant等。这些服务大多数在许多比听力装置如助听器(ha)或听力(助听器)系统具有更多计算资源(如存储器复杂性、计算复杂性、电池功率等)的设备上执行。
技术实现思路
1、听力装置(或与听力装置通信的相关设备)的功能可经话音控制接口进行评估(如控制)。话音控制接口可基于关键词检出(keyword spotting,kws)系统。话音控制接口可通过特定“唤醒词”启用。用于控制听力装置中的功能的口说命令(如“加大音量”)可由唤醒词及之后的命令词组成或者包括唤醒词及之后的命令词。命令词可能需要紧跟在唤醒词之后(之间没有其它命令词)或者在已检测到唤醒词之后的某一时间段内(如果唤醒词启用话音控制接口进行某一时间段,使得您仅需在话音控制接口已被启用时说出命令词)。
2、这样的系统或在听力装置中运行,或在与听力装置通信的外部设备中运行,或在听力仪器系统与外部设备的结合中运行(例如唤醒词检测在听力装置中,命令词检测(和/或一般的语音识别)在外部设备中)。
3、由于其有限的大小和电池功率,听力装置(如助听器)相较于外部设备具有有限的计算能力。因而在外部设备中进行计算量大的计算
4、听力装置通常经无线链路(图10中的wl1,wl2)连接到外部设备。在外部设备中进行的计算因而可能需要听力装置与外部设备之间的数据传输。数据传输如音频信号的传输同样耗用听力装置电池。为此,可能对检测音频信号何时应被传给外部设备感兴趣(及仅在应用考虑感兴趣时传输音频信号)。这在图11a、11b、11c的多个不同实施例中示出。
5、然而,可能对在听力装置或听力系统本地执行关键词检出算法感兴趣,即用于检测唤醒词/命令词的算法。本专利技术的目标在于通过将关于用户自我话音(ov)活动的信息包含在kws过程中而改进现有kws解决方案。唤醒词检测可由用户经用户接口启动或停止(例如在听力装置的特定运行模式下)。从而可节能,直到用户想要话音控制接口“可启用”为止。作为备选或另外,唤醒词检测可由ov活动的检测启动。
6、听力装置(如助听器)中的kws相较例如在智能电话上运行的系统如siri和alexa具有潜在的优点:检测用户何时说话更容易。这是因为,对于ha系统,专用传感器或算法可用于检测自我话音活动。对于ha系统,前述传感器(参见下面)可置放在用户身上,因此使能更鲁棒地检测用户的ov活动。
7、将ov信息与kws系统结合可导致计算及性能优点,如下所述。
8、有权使用关于ov活动的可靠信息的kws系统计算代价较低。具体地,该kws系统(通常执行的计算代价高)仅需要在ov检测器判断有合理概率存在ov活动时执行。此外,如果ov检测机制因其它目的已经可用或者可从以任何方式执行的算法容易地得出(如助听器系统情形),则kws系统除kws之外不需要处理ov检测(即计算节约)。
9、此外,当kws系统实际上执行时(即当ov检测器判断ov活动可能以某一概率存在时),ov信息可用于改善kws系统的输出。例如,如果kws系统判断关键词极可能被说出,但ov活动检测器判断ov活动的概率低,则最终判定可以是关键词未被用户说出,而是可能由竞争性讲话者说出。因此,将ov信息与kws系统的输出结合可导致性能提高,即降低假正率。
10、自我话音标示(如“自我话音标志”)可从听力装置传给外部设备,例如用于进一步使用或处理。自我话音的估计对外部设备可能是有用的信息。
11、关键词检出:对于唤醒词/关键词检出,已经存在几种系统,如siri、alexa、googleassistant等。这些系统通常不进行明确的话音活动检测。
12、话音控制接口可一直打开并准备好检测有限数量的关键词kwx,x=1,…,q之一,其中q可以是2-100级的数,如2到20之间,如5到15之间。然而,话音控制接口也可一般处于低功率“睡眠”模式(或关),及仅通过特定唤醒词启用(唤醒),例如仅在佩戴听力装置的用户说话时启用(或者,非必须地,仅由听力装置适合的特定用户启用)。在本申请中,特定唤醒词记为kw1。话音控制接口包括关键词检出系统,其配置成检测呈现给关键词检出系统的当前音频流中是否存在或者以何种概率存在特定关键词kwx。唤醒词可通过特定唤醒词检测器(例如位于听力装置中)进行检测,其余q-1个关键词可由单独的关键词检出系统(例如位于听力装置或另一装置中)检测。作为备选,唤醒词可由检测其它q-1个关键词的同一关键词检出系统(例如位于听力装置中或者另一如外部设备中)进行检测。优选地,唤醒词(或短语)应选择为下述之一或多个(如全部):a)独一无二(在一般会话中不常使用);b)相当长(以提供其特征的一些变化)但不太长(以不引起不必要的处理);c)国际化(以简化制造);d)在有噪声环境中可识别。
13、用户自我话音检测:通常,一般的话音活动检测算法用于ha系统中的ov检测。这些算法通常基于调制,但存在几种其它原理,如[1,2,3]。也可预见其它、可能更好的ov活动检测方法(参见下面)。
14、ov的检测也可用于提取(例如用户说出的)音频序列,其为kws目的进一步处理。该序列例如可在(听力装置中)本地处理,或传到辅助(如外部)装置进行进一步处理。在关键词仅在ov序列开始时出现的(示例性)假设下,仅ov音频序列的第一部分(如少于1-2秒)需要进一步处理以进行kws。因而,仅在用户自我话音在关键词之前的第一预定时间段尚不存在且在关键词正被说出时用户的话音活动时,关键词可被接受为有效关键词。
15、关键词检出与用户自我话音检测结合:us20190075406a1及我们于2018年6月22日申请的欧洲未决专利申请ep18179374.6提及使用听力装置中的自我话音波束形成器/检测器识别关键词的想法。
16、第一听力装置
17、在本申请的一方面,提供一种听力装置如助听器,其配置成至少部分设置在用户头上或者至少部分植入在用户头中。该听力装置包括:
18、-至少一输入变换器,用于从环境拾取输入声音信号并提供表示所述输入声音信号的至少一电输入信号;
19、-连接到所述至少一输入变换器的信号处理器,所述信号处理器配置成分析所述电输入信号并根据其提供传输控制信号。
20、听力装置还可包括:
21、-存储缓冲器如循环缓冲器,用于存储某一持续时间的本文档来自技高网...
【技术保护点】
1.一种听力装置,配置成至少部分设置在用户头上或者至少部分植入在用户头中,所述听力装置包括:
2.根据权利要求1所述的听力装置,包括话音控制接口。
3.根据权利要求1或2所述的听力装置,其中,所述信号处理器包括连接到至少一输入变换器的自我话音检测器,所述自我话音检测器配置成提供估计给定输入声音信号是否或者以何种概率源自听力装置用户的话音的自我话音标示。
4.根据权利要求3所述的听力装置,其中,所述信号处理器包括配置成根据自我话音标示提供传输控制信号的控制器。
5.根据权利要求4所述的听力装置,其中,所述信号处理器配置成将存储缓冲器中当前存储的数据的一部分传给外部设备,该数据部分在自我话音检测之前的开始时间段开始。
6.根据权利要求4所述的听力装置,其中,所述信号处理器配置成在停止时间段之后停止从存储缓冲器传输数据。
7.根据权利要求1所述的听力装置,其中,所述存储缓冲器配置成使能存储高达5秒时间段的音频。
8.根据权利要求3所述的听力装置,其中,所述信号处理器包括唤醒词检测器,其配置成在至少一电输
9.根据权利要求8所述的听力装置,其中,所述信号处理器包括配置成根据唤醒词标示提供传输控制信号的控制器。
10.根据权利要求8所述的听力装置,其中,所述控制器配置成根据唤醒词标示和自我话音标示提供传输控制信号。
11.根据权利要求1所述的听力装置,其中,传输时间段限于取决于所涉及的唤醒词的预期长度的持续时间。
12.根据权利要求8所述的听力装置,其中,所述唤醒词检测器通过基于神经网络的算法实施。
13.根据权利要求12所述的听力装置,其中,神经网络的输入向量包括至少一电输入信号。
14.根据权利要求13所述的听力装置,其中,神经网络的输入向量另外包括指明至少一电输入信号中存在用户话音的自我话音控制信号。
15.根据权利要求12所述的听力装置,其中,神经网络的输出向量包括检测到的唤醒词和/或检测到唤醒词的概率。
16.根据权利要求8所述的听力装置,其中,所述唤醒词检测器配置成检测用于特定应用的唤醒词。
17.根据权利要求1所述的听力装置,由助听器、头戴式耳机、耳麦、主动耳朵保护装置或其组合构成,或者包括助听器、头戴式耳机、耳麦、主动耳朵保护装置或其组合。
18.听力装置的运行方法,所述听力装置配置成至少部分设置在用户头上或者至少部分植入在用户头中,所述方法包括:
...【技术特征摘要】
1.一种听力装置,配置成至少部分设置在用户头上或者至少部分植入在用户头中,所述听力装置包括:
2.根据权利要求1所述的听力装置,包括话音控制接口。
3.根据权利要求1或2所述的听力装置,其中,所述信号处理器包括连接到至少一输入变换器的自我话音检测器,所述自我话音检测器配置成提供估计给定输入声音信号是否或者以何种概率源自听力装置用户的话音的自我话音标示。
4.根据权利要求3所述的听力装置,其中,所述信号处理器包括配置成根据自我话音标示提供传输控制信号的控制器。
5.根据权利要求4所述的听力装置,其中,所述信号处理器配置成将存储缓冲器中当前存储的数据的一部分传给外部设备,该数据部分在自我话音检测之前的开始时间段开始。
6.根据权利要求4所述的听力装置,其中,所述信号处理器配置成在停止时间段之后停止从存储缓冲器传输数据。
7.根据权利要求1所述的听力装置,其中,所述存储缓冲器配置成使能存储高达5秒时间段的音频。
8.根据权利要求3所述的听力装置,其中,所述信号处理器包括唤醒词检测器,其配置成在至少一电输入信号或从其得出的信号中检测预定唤醒词并提供估计是否或以何种概率检测到唤醒词的唤醒词标示。
9.根据权利要求8所述的听力装置,其中,所述...
【专利技术属性】
技术研发人员:N·H·罗德,T·本特森,A·B·奥尔森,A·H·安德森,M·S·彼得森,S·O·皮特森,J·詹森,M·S·克里斯腾森,
申请(专利权)人:奥迪康有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。