用于对助听器的音频信号进行个性化信号处理的方法技术

技术编号:25602503 阅读:25 留言:0更新日期:2020-09-11 23:59
本发明专利技术涉及一种用于对助听器的音频信号(12)进行个性化信号处理的方法,其中在识别阶段(1)中,通过辅助设备(4)产生第一图像记录(8),根据第一图像记录推断出优选的对话者(10)的存在,并且然后关于特征性的讲话者辨别参数(30)对音频信号(12)和/或辅助设备(4)的辅助音频信号的第一音频序列(14)进行分析,并且将在第一音频序列(14)中确定的讲话者辨别参数(30)存储在数据库(31)中,并且其中,在应用阶段(40)中,关于所存储的讲话者辨别参数对音频信号进行分析,并由此关于优选的对话者的存在对音频信号进行评估,并且在识别到存在优选的对话者的情况下,在音频信号中强调优选的对话者的信号份额。

【技术实现步骤摘要】
用于对助听器的音频信号进行个性化信号处理的方法
本专利技术涉及一种用于对助听器的音频信号进行个性化信号处理的方法。本专利技术还涉及一种具有用于执行这种方法的助听器的系统。
技术介绍
在对语音信号、即其信号份额在很大程度上来自语音份额的音频信号进行音频信号处理的领域中,通常会产生以下问题:在所记录的音频信号中要相对于噪声背景提高语音份额,即相对于其余的信号份额将语音份额放大。对这种音频信号的这类放大可以通过复杂的、非实时的信号处理算法实现,在这些音频信号中以相对于记录明显时间错开的方式设置了再现,即例如在用于电影制作的声迹记录的情况下,而这对于需要根据噪声背景的类型和根据要产生的输出信号的质量要求实时进行信号处理的情况来说要困难得多。例如,在使用助听器补偿助听器用户的听力损失时存在这种信号处理。因为对于具有听力损失的人员本身来说,由于由此形成的语音清晰度的损失会恰好在交谈环境下以特别不舒服的形式进行倾听,因此在助听器中相对于噪声背景将语音信号的放大或者通常对具有相应语音信号份额的音频信号的语音清晰度进行改善是特别重要的。由于助听器在此应以与用户的听力损失尽可能一致的方式向用户提供用户在其中重新找回自己的真实声学环境,因此在此要实时地或以尽可能短的时间延迟进行信号处理。在此,对语音份额的放大特别是在较复杂的声学情况下成为对用户的重要支持,在该较复杂的声学情况下存在多个讲话者,其中可能不是所有的讲话者都被视为是重要的(例如所谓的鸡尾酒会情况)。然而,由于用户的日常生活和生活状况,通常存在一些人员,由于假定的、他们对用户的重要性要始终将这些人员的语音份额放大,而与其他情况或其他条件无关。对于用户的亲密家庭成员,或者对于尤其是老年用户的护理人员来说通常是这种情况。特别是在较复杂的声学环境和情况下,由用户来控制优选的对话者的语音份额的这种“个性化”放大,会为用户带来频繁地对信号处理的相应模式进行控制和改变,也是由于在对话份额方面对专注度的负面影响,这是非常不希望的。
技术实现思路
因此,本专利技术要解决的技术问题是,针对助听器的音频信号提供一种方法,借助该方法能够尽可能自动且可靠地相对于其他信号份额实时地对优选的对话者的语音份额进行强调。此外,本专利技术还要解决的技术问题是,提供一种具有助听器的系统,该助听器适用于并且被设计为用于执行这种方法。根据本专利技术,首先提到的技术问题通过用于对助听器的音频信号进行个性化信号处理的方法来解决,其中针对音频信号在识别阶段中通过辅助设备产生第一图像记录,根据图像记录推断出优选的对话者的存在,并且然后关于特征性的讲话者辨别参数对音频信号和/或辅助设备的辅助音频信号的第一音频序列进行分析,并且将在第一音频序列中确定的讲话者辨别参数存储在数据库中。根据本专利技术,在此进一步规定,在应用阶段中,关于所存储的讲话者辨别参数对音频信号进行分析,并由此关于优选的对话者的存在对音频信号进行评估,并且在识别到存在优选的对话者的情况下,在音频信号中特别是相对于其他信号份额来强调优选的对话者的信号份额。在下面的描述中提出了有利的并且部分视为有创造性的另外的设计方案。根据本专利技术,第二提到的技术问题通过具有助听器和辅助设备的系统来解决,其中辅助设备被设计为用于产生图像记录,并且其中该系统被设计为用于执行之前描述的方法。优选地,辅助设备在此被设计为移动电话。在此,根据本专利技术的系统共享根据本专利技术的方法的优点。针对该方法并且针对随后提到的该方法的扩展产生的优点可以比照地转用到系统。在此,助听器的音频信号特别是包括如下信号:该信号的信号份额直接或以进一步处理的形式经由助听器的输出变换器输出到助听器的用户的听觉器官作为输出声音。特别地,音频信号因此由在助听器中进行的信号处理过程的中间信号给出,并且由此不仅作为次级的控制信号用于对另外的初级信号进行信号处理,在初级信号上发生由助听器的一个或多个输出变换器输出的信号,而且本身还形成这种初级信号。在此,识别阶段特别是通过确定讲话者辨别参数的时间段来给出,在讲话者辨别参数的基础上,应当在应用阶段中对优选的对话者的存在进行识别。在这种情况下,所述应用阶段本身在此特别是通过在其中根据所描述的识别到优选的对话者的存在而相应地调整信号处理的时间段给出。在此并且在下文中,图像记录特别是包括静止图像和视频序列,即包括多个静止图像的连续序列。在此,辅助设备特别是相应地被设计为用于产生第一图像记录,即被设计为特别是通过照相机或类似的设备来对周围环境的图像进行光学记录。优选地,辅助设备在此附加地被设计为,除了图像记录或通过图像记录触发之外还将相应的命令发送到助听器,以启动分析过程。在此,优选在时间上紧邻第一图像记录的产生,从第一图像记录中推断出优选的对话者的存在。因此,优选地在产生第一图像记录与开始音频信号的第一音频序列之间仅度过所述分析所需的时间、即优选小于60秒、特别优选小于10秒,该第一图像记录特别是自动启动了相应的、关于优选的对话者对所产生的图像材料的分析。然而对于在识别阶段分析音频信号的第一音频序列,在此不需要在第一图像记录之后记录第一音频序列。而是也可以在识别阶段中进行对音频信号的连续(特别是仅在此期间的)记录,并且根据第一图像记录,借助第一图像记录的时间参考从所述音频信号的记录中提取第一音频序列,其中该时间参考不一定必须标记第一音频序列的开始,而是还可以标记例如第一音频序列的中间或结束。特别地,第一音频序列具有预先给定的长度、优选至少10秒、特别优选至少25秒。特别是根据由助听器用户预定义的标准、例如通过第一图像记录与人员的图像记录的比较来选择是否将人员视为优选的对话者,所述人员根据助听器用户自己的说明对于用户具有特别重要性、例如是家庭成员或亲密朋友。这种说明例如在对所提到人员的图像的相应分类中可能是作为“收藏夹”的虚拟图片库。但是,该选择还可以在用户没有关于优选的对话者进行明确说明的情况下自动进行,例如通过对存储在辅助设备中的图像数据执行频度分析,并且将频繁重复出现的人员辨别为优选的对话者。在此,特别是将如下参数理解为特征性的讲话者辨别参数:该参数能够根据语音实现对讲话者的辨别,并且为此能够量化地描述语音信号的特征、即例如例如频谱和/或时间特征、因此特别是韵律特征。现在,根据在识别阶段确定的讲话者辨别参数(其相应地已存储在数据库中)在应用阶段中特别是根据相应的命令或者也在作为标准预设的自己设置的助听程序中关于这些存储的讲话者辨别参数对音频信号进行分析,以便能够根据讲话者辨别参数识别预定义为优选的对话者的人员的存在。在识别阶段期间根据第一图像记录识别到了优选的对话者的存在,从而启动了对第一音频序列的分析以获得特征性的讲话者辨别参数,而在应用阶段可以恰好根据这些存储在数据库中的讲话者辨别参数来识别优选的对话者的存在。然后,现在对助听器的信号处理进行调谐,使得在音频信号中将优选的对话者的信号份额或估计的信号份额相对于其他信号份额、特别是相对于其他语音份额以及相对于噪声背景进行突出,即相对于这些被放大。在此,优选地在助听本文档来自技高网
...

【技术保护点】
1.一种用于对助听器的音频信号(12)进行个性化信号处理的方法,/n其中在识别阶段(1)中:/n-通过辅助设备(4)产生第一图像记录(8),/n-根据所述第一图像记录(8)推断出优选的对话者(10)的存在,并且然后关于特征性的讲话者辨别参数(30)对所述音频信号(12)和/或所述辅助设备(4)的辅助音频信号的第一音频序列(14)进行分析,并且/n-将在所述第一音频序列(14)中确定的讲话者辨别参数(30)存储在数据库(31)中,并且/n其中,在应用阶段(40)中,/n-关于所存储的讲话者辨别参数(30)对所述音频信号(12)进行分析,并由此关于优选的对话者(10)的存在对所述音频信号进行评估,并且/n-在识别到存在优选的对话者(10)的情况下,在所述音频信号(12)中强调优选的对话者的信号份额。/n

【技术特征摘要】
20190205 DE 102019201456.91.一种用于对助听器的音频信号(12)进行个性化信号处理的方法,
其中在识别阶段(1)中:
-通过辅助设备(4)产生第一图像记录(8),
-根据所述第一图像记录(8)推断出优选的对话者(10)的存在,并且然后关于特征性的讲话者辨别参数(30)对所述音频信号(12)和/或所述辅助设备(4)的辅助音频信号的第一音频序列(14)进行分析,并且
-将在所述第一音频序列(14)中确定的讲话者辨别参数(30)存储在数据库(31)中,并且
其中,在应用阶段(40)中,
-关于所存储的讲话者辨别参数(30)对所述音频信号(12)进行分析,并由此关于优选的对话者(10)的存在对所述音频信号进行评估,并且
-在识别到存在优选的对话者(10)的情况下,在所述音频信号(12)中强调优选的对话者的信号份额。


2.根据权利要求1所述的方法,其中根据面部识别对所述第一图像记录(8)中的优选的对话者(10)进行识别。


3.根据权利要求1或2所述的方法,其中作为所述辅助设备(4)使用移动电话(6)和/或数据眼镜。


4.根据上述权利要求中任一项所述的方法,其中所述识别阶段(1)的分析的至少一部分和/或所述识别阶段(1)的音频信号的产生在所述辅助设备(4)中进行。


5.根据上述权利要求中任一项所述的方法,其中作为所述讲话者辨别参数(30)对
-多个音调和/或
-多个共振峰频率和/或
-多个音素谱和/或
-重音的分布和/或
-音素和/或语音停顿的时间走向
进行分析。


6.根据上述权利要求中任一项所述的方法,
其中将所述第一音频序列(14)分解为多个子序列(18,18a,18b),
其中针对每个子序列(18,18a,18b)分别确定语音清晰度参数(24)和/或信噪比(22),并将其与相关的标准进行比较,并且
其中针对关于特征性的讲话者辨别参数(30)的分析仅考虑分别满足标准的子序列(18,18a,18b)。


7.根据上述权利要求中任一项所述的方法,
其中将所述第一音频序列(14)分解为多个子序列(18,18a,18b),
其中对助听器(2)用户自己的语音活动进行监视(20),并且
其中针对关于特征性的讲话者辨别参数(30)的分析仅考虑用户自己的语音活动的比例不超过预先给定的上限的子序列(18,18a,18b)。


8.根据上述权利要求中任一项所述的方法,
其中通过所述辅助设备(4)产生第二图像记录(32),
其中根据第二图像记录(32),...

【专利技术属性】
技术研发人员:M弗罗利希
申请(专利权)人:西万拓私人有限公司
类型:发明
国别省市:新加坡;SG

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1