包括低延时声源分离单元的听力装置制造方法及图纸

技术编号：13171465 阅读：31 留言：0更新日期：2016-05-10 14:53

本发明专利技术公开了包括低延时声源分离单元的听力装置，其包括：输入单元；适合保存最后A个音频样本的循环分析缓冲器单元；及适合保存最后L个音频样本的循环合成缓冲器单元；已保存记录的声音例子的数据库，每一记录的声音例子称为原子，对于每一原子，来自第一缓冲器的音频样本与来自第二缓冲器的音频样本重叠，源自第一缓冲器的原子构成重构字典，源自第二缓冲器的原子构成分析字典；声源分离单元，用于分离电输入信号以提供表示至少两个声源的至少两个分离信号，所述声源分离单元配置成，考虑数据库的分析字典中的原子确定最后A个音频样本的最佳表示，及通过使用最佳表示组合数据库的重构字典中的原子而产生L个音频样本的至少两个分离信号。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及听力装置，尤其涉及多声源环境中的声源分离。本专利技术具体涉及包括用于提供表示来自多个声源产生的声音环境的声音的一个或多个电输入信号的输入单元的听力装置。本申请还涉及多声源环境中分离声源的方法。本申请还涉及包括处理器和程序代码的数据处理系统，程序代码使得处理器执行本专利技术方法的至少部分步骤。本专利技术的实施例如可用在下述应用中：听力装置如助听器、头戴式耳机、耳麦、有源耳朵保护系统、免提电话系统、移动电话、远程会议系统、广播系统、卡拉OK系统、教室放大系统等。
技术介绍
音频声源分离包括分离音频混合物（音频混合物包括来自声场中混合的多个声源的声音）内的不同成分声源的任务。目前，解决该问题的大多数方法已"离线"执行，意味着整个音频混合物在分离时存在（通常为数字式录音的形式），而不是"实时"存在，其中随着新的音频数据进入系统，声源被分离。在鸡尾酒会情形下，多个竞争性讲话者的存在使得听单一声源传输的信息很困难，但成功的声源分离能够一次向听者呈现仅从单一讲话者呈现的?目息。为使声源分离可用在真实通信情形中，其应实时进行或以非常低的延时进行。如果在讲出的音频和分离的音频之间出现明显的处理时延，听者可能被讲话者嘴巴运动和对应的音频之间的不同步弄得烦恼不安，及较少获益于可能的唇读。因此，以低延时（如在进入和离开系统的音频样本之间低于20ms)运行的声源分离方法是有利的。当前的（基于附加混合模型的）声源分离方法依赖于使用相当长的分析帧（通常为>50ms级），如果直接实施，其将违反低延时要求。在本说明书中，...

【技术保护点】
一种听力装置，包括：‑输入单元，用于递送表示包括至少两个声源的音频信号的时变电输入信号；‑适合保存最后A个音频样本的长度为A的循环分析缓冲器单元；及‑适合保存最后L个音频样本的长度为L的循环合成缓冲器单元，其中L小于A，L个音频样本计划分离在各个声源中；‑已保存来自至少两个声源的记录的声音例子的数据库，数据库中的每一记录的声音例子称为原子，所述原子源自来自大小分别对应于合成和分析缓冲器单元的第一和第二缓冲器的音频样本，对于每一原子，来自第一缓冲器的音频样本与来自第二缓冲器的音频样本重叠，及其中源自第一缓冲器的原子构成重构字典，及其中源自第二缓冲器的原子构成分析字典；所述听力装置还包括：‑声源分离单元，用于分离电输入信号以提供表示至少两个声源的至少两个分离信号，所述声源分离单元配置成，考虑数据库的分析字典中的原子确定最后A个音频样本的最佳表示(W)，及通过使用最佳表示(W)组合数据库的重构字典中的原子而产生L个音频样本的至少两个分离信号。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：T·巴克尔，T·维塔雷恩，N·H·彭托皮丹，
申请(专利权)人：奥迪康有限公司，
类型：发明
国别省市：丹麦;DK

全部详细技术资料下载我是这个专利的主人