具有骨传导传感器的听力设备制造技术

技术编号:32159177 阅读:9 留言:0更新日期:2022-02-08 15:10
本发明专利技术涉及一种听力设备,包括:骨传导传感器,所述骨传导传感器被配置为将话音声音信息的骨振动转换成骨传导信号;信号处理单元,所述信号处理单元被配置为实现合成语音生成过程,所述合成语音生成过程实现语音模型;其中所述合成语音生成过程接收所述骨传导信号作为控制输入并且输出合成语音信号。作为控制输入并且输出合成语音信号。作为控制输入并且输出合成语音信号。

【技术实现步骤摘要】
【国外来华专利技术】具有骨传导传感器的听力设备


[0001]本专利技术涉及一种包括骨传导传感器的听力设备。

技术介绍

[0002]在涉及头戴式听力装置(诸如耳机、有源听力保护器和听力仪器或助听器)的许多通信应用中,获取干净的语音信号是相当重要的。一旦获取,干净的语音信号可以例如经由无线数据通信链路供应给干净的语音信号的远端接收方,以便提供更易理解和/或听起来更舒适的语音信号。通常期望获得干净的语音信号,该干净的语音信号例如在电话交谈期间为远端接收方提供更好的语音清晰度和/或更好的舒适度,作为语音识别系统、话音控制系统等的输入。
[0003]然而,头戴式听力装置的用户所处的声音环境经常受到多种噪声源(诸如干扰说话者、交通噪声、嘈杂的音乐、来自机械的噪声等)的破坏或影响。当记录空气传播声音的麦克风拾取说话者的声音时,此类环境噪声源可能导致目标语音信号的信噪比比较低。此类麦克风可能对来自用户声音环境的各个方向的声音敏感,并且因此倾向于不加区别地拾取所有环境声音,并将其作为受噪声影响的语音信号传输到远端接收方。虽然可以通过使用具有特定方向特性的麦克风或使用所谓的悬臂麦克风(通常用于耳机)在一定程度上缓解环境噪声问题,但本领域需要一种听力设备,该其具有通过例如无线数据通信链路传输到远端接收方的用户语音的改进信号质量,特别是改进的信噪比。通信链路可包括蓝牙链路或网络、Wi

Fi链路或网络、GSM蜂窝链路、有线连接等。
[0004]EP3188507公开了一种头戴式听力装置,其检测并利用在用户耳道中拾取的用户自身声音的骨传导分量,以在特定声音环境条件下提供具有改进的信噪比的混合语音/话音信号以用于传输到远端接收者。除了用户自身话音的骨传导分量之外,混合语音信号还可包括由头戴式听力装置的环境麦克风布置拾取的用户自身话音的分量/贡献。从环境麦克风布置衍生的该附加话音分量可包括用户自身话音的高频分量,以至少部分地恢复混合麦克风信号中的用户话音的原始频谱。
[0005]WO 00/69215公开了一种话音声音传输单元,该话音声音传输单元具有适于插入到用户外耳道中的耳机,该耳机具有骨传导传感器和空气传导传感器两者。骨传导传感器适于接触外耳道的一部分以将话音声音信息的骨振动转换成电信号。空气传导传感器驻留在耳道内并且将话音声音信息的空气振动转换成电信号。在其优选形式中,语音处理器对来自骨传导传感器和空气传导传感器的输出进行采样以对噪声进行滤波并选择纯话音声音信号以用于传输。话音声音信号的传输可通过无线链接并且还可被配备扬声器和接收器以实现双向通信。
[0006]虽然骨传导信号具有声音和环境噪声对骨传导信号影响很小或没有影响的优点,但当使用骨传导信号表示说话者的声音时,骨传导信号存在许多缺陷。骨传导信号常常听起来很模糊;由于声音的身体传导和空气传导,它经常错过较高的频率和/或受到其他人工制品的影响。此外,骨传导信号可包括其他声音,诸如来自吞咽、下颌运动、耳

耳机摩擦等
的声音。由于耳机装配或机械耦接不完善,骨传导信号可能容易受到其他传感器噪声(嘶嘶)的影响。
[0007]为了改进由骨振动传感器产生的信号的质量,已经进行了各种尝试。为此,提出了各种滤波技术。例如,由T.Tamiya和T.Shimamura撰写的文章“Reconstruction Filter Design for Bone

Conducted Speech”,Interspeech 2004

ICSLP 8
th International Conference on Spoken Language Processing,ICC Jeju,Jeju Island,Korea,October 4

8,2004,涉及用于重建从说话者获取的骨传导语音信号的质量的数字滤波器。
[0008]然而,仍然期望提供一种听力设备来提高从具有骨传导传感器的听力设备获得的语音信号的质量,和/或提供其替代方案。

技术实现思路

[0009]根据第一方面,本专利技术涉及一种听力设备,包括:
[0010]‑
骨传导传感器,所述骨传导传感器被配置为记录指示由所述听力设备的佩戴者的骨骼传导的骨传导振动的骨传导信号;
[0011]‑
信号处理单元,所述信号处理单元被配置为实现合成语音生成过程,所述合成语音生成过程实现语音模型;
[0012]其中所述合成语音生成过程接收所述骨传导信号的表示作为控制输入并且输出合成语音信号,其中所述合成语音生成过程实现时间序列预测器,所述时间序列预测器被配置为根据所述时间序列的一个或多个先前样本预测所述时间序列的当前样本,所述时间序列表示语音波形,其中所述预测以所述骨传导信号的所述表示为条件。
[0013]专利技术人已经认识到,可通过采用创建合成语音的合成语音模型并且使用来自骨传导传感器的骨传导信号来指导合成语音构建过程来获得高质量的语音重建。具体地,合成语音生成过程被配置为生成人工人类语音。合成语音生成过程可合成表示人工语音的音频信号的波形。信号处理单元的实施例因此实现了用于人类语音的人工产生的语音合成器。语音合成器包括语音模型,即语音生成过程知道如何生成语音信号。语音合成器的一些实施例即使在没有任何控制输入的情况下也能够生成语音信号。
[0014]在一些实施例中,语音模型是在操作期间定义限定状态的语音模型,其中内部状态随时间推移而演变。因此,语音模型表现出时间动态行为,从而促进了表示音频信号波形的时间序列的创建。
[0015]在一些实施例中,语音模型是经训练的机器学习模型。具体地,机器学习模型可在训练阶段期间基于多个训练语音示例来进行训练。每个训练语音示例可包括表示说话者的语音的训练骨传导信号和表示由环境麦克风记录的空气传播声音的对应训练麦克风信号,记录所述扬声器的语音的空气传播声音,具体地与训练骨传导信号的记录同时记录。因此,机器学习模型可由机器学习算法训练,以在由训练骨传导信号控制时创建近似训练麦克风信号的合成语音。因此,训练麦克风信号用作训练阶段中的目标信号。一旦机器学习模型被训练,它可仅基于骨传导信号生成合成语音,即当作为语音合成器操作时,不需要环境麦克风信号作为经训练语音模型的输入。因此,语音模型被配置为仅基于骨传导信号生成合成语音,所生成的合成语音近似于空气传导话音声音。合成语音生成过程将骨传导信号的表示作为输入馈送到语音模型中。该表示可表示骨传导信号或其一个或多个特征,特别是骨
传导信号的一个或多个与时间相关特征。合成语音生成过程不需要对语音进行任何识别,即其不要求该过程推断语音的含义。
[0016]机器学习语音模型的建立只需要实际语音的很少假设和极少的关于待重建语音特征的先验知识。相反,模型是基于训练示例池来创建的。具体地,训练示例可包括表示听力设备的特定用户的语音的骨传导信号和环境麦克风信号。因此,听力设备可适用于特定用户并且可训练语音模型以合成特定用户的话音。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种听力设备,包括:

骨传导传感器,配置为记录指示由所述听力设备的佩戴者的骨骼传导的骨传导振动的骨传导信号;

信号处理单元,配置为实现合成语音生成过程,所述合成语音生成过程实现语音模型;其中,所述合成语音生成过程接收所述骨传导信号的表示作为控制输入并输出合成语音信号,其中所述合成语音生成过程实现时间序列预测器,所述时间序列预测器配置为根据时间序列的一个或多个先前样本预测所述时间序列的当前样本,所述时间序列表示语音波形,其中预测以所述骨传导信号的所述表示为条件。2.根据权利要求1所述的听力设备,其中,所述语音模型定义在操作期间随时间演化的内部状态。3.根据前述权利要求中任一项所述的听力设备,其中,所述语音模型是基于多个训练语音示例进行训练的经训练的机器学习模型。4.根据权利要求3所述的听力设备,其中,每个训练语音示例包括表示说话者的语音的训练骨传导信号和表示由环境麦克风记录的所述说话者的语音的空气传播声音的对应的训练麦克风信号,在记录所述训练骨传导信号的同时记录所述空气传播声音。5.根据权利要求3至4中任一项的听力设备,其中,所述机器学习模型包括神经网络,优选其中所述神经网络包括递归神经网络。6.根据权利要求5所述的听力设备,其中,所述神经网络包括递归神经网络。7.根据权利要求6所述的听力设备,其中,所述递归神经网络以密度估计模式操作。8.根据权利要求5至7中任一项的听力设备,其中,所述神经网络包括分层神经网络,所述分层神经网络包括两层或更多层。9.根据前述权利要求中任一项所述的听力设备,其中,所述语音模型包括自回归语音模型。10.根据前述权利要求中任一项所述的听力设备,其中,所述语音模型计算多个输出类的概率分布,每个输出类表示采样音频波形的样本的样本值。11.根据前述权利要求中任一项所述的听力设备,包括头戴式听力装置,所述头戴式听力装置包括所述骨传导传感器和第一通信接口。12.根据权利要求11所述的听力设备,其中,所述头戴式听力装置还包括所述信号处理单元,并且其中所述头戴式装置配置为经由所述第一通信接口将所述合成语音信号传送到所述头戴式听力装置外部的外部装置。13.根据权利要求11所述的听力设备,包括信号处理装置,其中,所述头戴式听力装置配置为经由所述第一通信接口将所述骨传导信号传送到所述信号处理装置,其中,所述信号处理装置包括所述信号处理单元和配置为接收所述骨传导信号的第二通信接口。14.根据前述权利要求中任一项所述的听力设备,包括环境麦克风,所述环境麦克风配置为记录由所述听力设备的用户所说的空气传播语音...

【专利技术属性】
技术研发人员:A
申请(专利权)人:大北欧听力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1