听力装置中的声源分离及相关方法制造方法及图纸

技术编号：29602767 阅读：23 留言：0更新日期：2021-08-06 20:08

本发明专利技术公开了一种听力装置(4)、附件装置(6)和操作包括听力装置(4)和附件装置(6)的听力系统(2)的方法(100)，该方法包括：在附件装置(6)中获取表示来自一个或多个音频源的音频的音频输入信号(102)；通过附件装置(6)的摄像头(46)获取图像数据(104)；基于图像数据识别包括第一音频源的一个或多个音频源(106)；确定包括第一模型系数的第一模型(108)，其中第一模型基于第一音频源的图像数据和音频输入信号；以及向听力装置(4)传输(110)听力装置信号，其中听力装置信号基于第一模型。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】听力装置中的声源分离及相关方法
本专利技术公开了一种听力系统的听力装置和附件装置以及包括操作听力装置的方法的相关方法。
技术介绍
在听力装置处理中，听力装置用户处于具有多个语音和/或其他声源的多源环境中的情况，即所谓的鸡尾酒会效应，不断对听力装置开发人员提出挑战。鸡尾酒会效应的问题在于，从与目标语音信号相同频率范围和相近相似接近度的多个其他语音中分离出单个语音。近年来，单边(经典)波束成形器和双边波束成形器已成为助听器的标准解决方案。波束形成器在近场和/或混响情况下的能力并不总是足以提供令人满意的听觉体验。通常，波束形成器的性能是通过使波束变窄从而更强地抑制波束外部的源而得到提高。然而，在现实生活中，声源和/或助听器用户的头部处于移动过程中，因此会产生所需的声源可能移入和移出波束的情况，这会导致相当混乱的声学情况。
技术实现思路
因此，需要一种具有改进的声源分离的听力装置和方法。一种操作包括听力装置和附件装置的听力系统的方法，该方法包括在附件装置中获取表示来自一个或多个音频源的音频的音频输入信号；用附件装置的摄像头获取图像数据；基于图像数据识别包括第一音频源的一个或多个音频源；确定包括第一模型系数的第一模型，其中第一模型基于第一音频源的图像数据和音频输入信号；以及向听力装置传输听力装置信号，其中听力装置信号基于第一模型此外，公开了一种用于听力系统的附件装置，听力系统包括该附件装置和听力装置，附件装置包括处理单元、存储器、摄像头和接口。处理单元被配置为从一个或多个音频...

【技术保护点】
1.一种操作听力系统的方法，所述听力系统包括听力装置和附件装置，所述方法包括以下步骤：/n在所述附件装置中获取表示来自一个或多个音频源的音频的音频输入信号；/n通过所述附件装置的摄像头获取图像数据；/n基于所述图像数据识别包括第一音频源的一个或多个音频源；/n确定包括第一模型系数的第一模型，其中所述第一模型基于所述第一音频源的图像数据和所述音频输入信号；以及/n向所述听力装置传输听力装置信号，其中所述听力装置信号基于所述第一模型。/n

【技术特征摘要】
【国外来华专利技术】20181221 EP 18215415.31.一种操作听力系统的方法，所述听力系统包括听力装置和附件装置，所述方法包括以下步骤：
在所述附件装置中获取表示来自一个或多个音频源的音频的音频输入信号；
通过所述附件装置的摄像头获取图像数据；
基于所述图像数据识别包括第一音频源的一个或多个音频源；
确定包括第一模型系数的第一模型，其中所述第一模型基于所述第一音频源的图像数据和所述音频输入信号；以及
向所述听力装置传输听力装置信号，其中所述听力装置信号基于所述第一模型。

2.根据权利要求1所述的方法，其中，向所述听力装置传输听力装置信号的步骤包括：向所述听力装置传输第一模型系数。

3.根据权利要求2所述的方法，所述方法包括：在所述听力装置中，
从一个或多个音频源获取表示音频的第一输入信号；
基于所述第一模型系数处理所述第一输入信号以提供电输出信号；以及
将所述电输出信号转换为音频输出信号。

4.根据权利要求3所述的方法，其中，基于所述第一模型系数处理所述第一输入信号的步骤包括：对所述第一输入信号应用盲源分离。

5.根据权利要求3至4中任一项所述的方法，其中，基于所述第一模型系数处理所述第一输入信号的步骤包括：对所述第一输入信号应用深度神经网络，其中所述深度神经网络基于所述第一模型系数。

6.根据权利要求1至5中任一项所述的方法，其中，识别一个或多个音频源的步骤包括：基于所述图像数据确定所述第一音频源的第一位置、显示指示所述第一音频源的第一用户接口元素、以及检测选择所述第一用户接口元素的用户输入。

7.根据权利要求1至6中任一项所述的方法，其中，确定第一模型的步骤包括：基于所述图像数据确定所述第一音频源的唇部运动，并且其中所述第一模型基于所述唇部运动。

8.根据权利要求1至7中任一项所述的方法，其中，所述第一模型是具有N层的深度神经网络，其中N大于3，并且确定包括第一模型系数的第一模型的步骤包括：基于所述图像数据训练所述深度神经网络以提供所述第一模型系数。

9.一种听力系统的附件装置，所述...

【专利技术属性】
技术研发人员：A·蒂芬奥，
申请(专利权)人：大北欧听力公司，
类型：发明
国别省市：丹麦;DK

全部详细技术资料下载我是这个专利的主人