System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于确定音频处理参数的装置和方法制造方法及图纸_技高网

用于确定音频处理参数的装置和方法制造方法及图纸

技术编号:40583000 阅读:11 留言:0更新日期:2024-03-06 17:26
本发明专利技术涉及用于根据至少一个音频输入信号确定音频处理参数的装置和方法。

【技术实现步骤摘要】
【国外来华专利技术】

根据本专利技术的实施例涉及用于根据至少一个音频输入信号确定音频处理参数的装置和方法。根据本专利技术的实施例涉及具有人工智能的装置和方法,例如在声音再现设备中,装置和方法可以分析音频信号并在用户操作期间将它们分配给用户个人设置,或者可以将其组合。此外,实施例涉及用于基于在用户操作期间获得的音频信号确定音频处理参数的概念。


技术介绍

1、个人对声音的感知,以及因此声音再现装置对声音或和声的适应的单独要求,根据以下标准有所不同:

2、·个性化

3、·情境需求

4、·外部条件

5、声音感知因人而异。例如,在有很多人的房间里与一个人交谈,对有些人来说比其他人更难进行。此外,根据需要,对声音再现进行同样的调整会产生不同的感觉。环境参数,诸如听觉环境,也显著影响声音再现设备的声音适应的控制值。

6、当前的声音再现设备提供了不以自动化方式应用的特定声音适应。在声音再现设备中,诸如用于助听的便携式设备,诸如耳机、头戴式耳机或助听器,通常只包括用于声音适应的音量调整和均衡器。声音适应,诸如放大音量或调整更高或更低的音调,由用户执行一次。已经发现,为了获得持续良好的音质,每次进一步的声音再现都必须再次进行这些调整。

7、已经发现,在传统概念中,不仅对于不同的声音再现必须重复声音适应的过程,而且在声音再现设备中,听觉环境的变化例如不能自适应地适应环境声音。已经发现,即使环境噪声发生相对轻微的变化,语音理解的听力努力也会增加。

8、此外,已经发现,在传统概念中,声音适应只能基于制造商预先确定的声音默认设置来执行。已经发现,这些并不总是对应于用户的个人需求。因此,例如,存在如“音乐”这样的设置,其中不考虑音乐的优选品味和听音乐时的个人意图。例如,对声音体验的期望在歌剧演唱和电子音乐之间相比有很大的不同。在收听程序“音乐”的默认设置中,制造商仅以一般假设为依据,可能既不能满足歌剧演唱的声音体验要求,也不能满足科技音乐的声音体验要求,因此只能为用户提供不够充分的声音再现。

9、目前用于助听的声音再现设备,诸如助听器,根据其功能,价格可能高达数千欧元,因此对该设备的期望也相应很高。助听器的适应一般是在实验室条件下进行的,通常只有两个扬声器,并且只有非常有限的声音,诸如正弦音、噪音和声音。复杂的噪音情况,诸如十字路口的噪音,无法在听力实验室模拟,因此导致助听器用户的挫折感,在日常生活中很难达到令人满意的效果。

10、在声音重现的学习应用中,如github出版物“liketohear-ai-pt”,用户在文件中记录的助听器算法的情景参数变化和分配给该情景的记录的频谱分析由自学习算法处理。算法建立与用户的决策相关的特定频谱的相关性,并自动选择分配的参数作为预测模型的基础。在第二步中,将预测模型应用于先前记录的频谱分析。已经发现,频谱的复杂性不能通过这种用于声音再现的此学习应用来映射,因此不断需要进一步的用户适应。

11、考虑到上述陈述,需要在运行时确定音频处理参数的概念,从而在用户友好性、可获得的音频质量和实现努力之间进行更好的权衡。


技术实现思路

1、此目的由独立权利要求的主题解决。

2、本专利技术的实施例的核心思想是发现在运行时进行由用户直观执行的声音适应,并将其实时集成到学习系统中。

3、根据本专利技术的一个实施例包括用于根据例如来自音频输入的至少一个音频输入信号确定音频处理参数诸如用于音频处理的参数的装置,其中装置被配置为基于用户操作期间获得的音频信号以用户个性化的方式确定处理参数确定规则的至少一个系数,并且其中装置被配置为基于音频输入信号通过使用处理参数确定规则获得音频处理参数。例如,处理参数确定规则的系数可以是神经元网络的系数,该神经元网络获得音频输入信号或从中提取的输入信号参数作为输入量,并提供音频处理参数作为输出量。换句话说,处理参数确定规则的系数,例如,可以基于在用户操作中,例如在用户操作期间,获得的输入音频信号,以用户个性化的方式确定。此外,装置可以被配置为例如通过使用由至少一个系数定义的处理参数确定规则基于音频输入信号来获得音频处理参数。

4、本实施例基于以下核心思想:基于用户操作期间获得的音频信号,通过对处理参数确定规则的一个或多个系数进行用户个性化调整,使处理参数确定规则适应用户的个人习惯和愿望成为可能。通过使用用户操作期间获得的音频信号用于处理参数确定规则的系数的用户个性化调整,可以得到这些系数很好地适应于用户通常实际停留的那些(特定)听力情况。因此,不再需要对声学环境进行预分类(例如,将其分为一般类别“音乐”和一般类别“语音”),但系数可以适应用户例如收听音乐或语音的实际收听环境,以及用户的个人需求。例如,通过对处理参数确定规则的系数的适当选择,可以进行音频处理参数的即时的和用户个性化的确定,其中,例如,由系数调适的处理参数确定规则要求音频处理参数的立即确定,而不将声学环境分类为一个或多个静态预定的类别。相反,可以基于用户操作期间获得的音频信号来调适处理参数确定规则的系数,从而可以以“硬”或“软”方式(例如平滑过渡)区分与用户相关的用户期望不同音频处理参数的收听环境。

5、因此,通过考虑用户操作期间获得的音频信号(并相应地调整处理参数确定规则的系数),本专利技术概念允许,例如,当语音存在于用户所在的不同声学环境中(例如,嘈杂的开放式办公室、单个办公室、有许多卡车的十字路口、有电车交通的十字路口等)时,提供非常不同的音频处理参数。所提供的参数通常与用户在相应情况下期望的设置一致。

6、通过这种方式,本专利技术概念以合理的努力提供音频处理参数,这适应于个人用户的日常现实和他或她的特定偏好。

7、根据进一步的实施例,装置被配置为根据由用户调整的用户参数确定数据库,使得数据库的条目描述由用户调整的用户参数。例如,可以在用户操作期间实时建立数据库,并且可以确定预测模型。此外,数据库可以用于确定处理参数确定规则的系数,因为数据库包括用户参数的信息。例如,数据库还可以包括可以链接到用户参数的与人相关的控制设置。例如,由用户调整的用户参数可以代替音频处理参数作为输出量,或者它们可以改变音频处理参数,使得数据库的条目表示例如由用户调整的用户参数。例如,数据库至少部分地相应地集成到使用例如由用户调整的用户参数的强化学习中。

8、通过建立条目描述由用户调整的用户参数的数据库,可以例如连续地对处理参数确定规则的系数进行改进或优化。形成数据库并可以存储例如在数据库或另一个存储结构中的由用户调整的用户参数(通常在不同的声学环境中)可以表示音频处理参数的设置值。例如,如果存在对用户选择了用户参数的相应声学环境的音频信号(或音频信号特征)的用户参数的分配,则此数据库可用于确定处理参数确定规则的系数。通过确定数据库,例如,该数据库随着用户使用时间的增加而变得越来越大,可以获得,例如,随着时间的推移,存在一个更大的数据库,用于(自动)确定(或改进)处理参数确定规则的系数,其允许本文档来自技高网...

【技术保护点】

1.一种用于根据至少一个音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)确定音频处理参数(120;262;362;462;562)的装置(100;200;300;400;500);

2.根据权利要求1所述的装置(100;200;300;400;500),其中装置被配置为根据由用户调整的用户参数(232;332;432,433;532)确定数据库(252;352;452;552),使得数据库的条目(252;352;452;552)描述由用户调整的用户参数(232;332;432,433;532)。

3.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为根据至少一个音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)确定数据库(252;352;452;552),使得数据库的条目(252;352;452;552)描述音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)。

4.根据权利要求3所述的装置(100;200;300;400;500),其中装置被配置为确定数据库(252;352;452;552),使得数据库(252;352;452;552)描述不同音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)和由用户调整的相应用户参数(232;332;432;433;532)之间的分配。

5.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为根据音频输出信号(218;219;313;318;319;342)确定数据库(252;352;452;552),使得数据库的条目(252;352;452;552)描述音频输出信号(218;219;313;318;319;342)。

6.根据权利要求5所述的装置(100;200;300;400;500),其中装置被配置为确定数据库(252;352;452;552),使得数据库(252;352;452;552)描述不同音频输出信号(218;219;313;318;319;342)和由用户调整的相应用户参数(232;332;432,433;532)之间的分配。

7.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为基于由装置获得的数据库(252;352;452;552)调适处理参数确定规则(140;250;350;450;550)的至少一个系数(142;256;356;456;556),以通过用户个性化方式调适处理参数确定规则(140;250;350;450;550),以获得以用户个性化的方式调适的音频处理参数(120;262;362;462;562)。

8.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为基于数据库(252;352;452;552)提供或调适处理参数确定规则(140;250;350;450;550)。

9.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为基于由用户更正和/或修改的至少一个音频处理参数(120;262;362;462;562)确定和/或调适处理参数确定规则(140;250;350;450;550)的适应至少一个系数(142;256;356;456;556)。

10.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为基于音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)和基于音频处理参数(120;262;362;462;562)执行音频处理(220;320;420;520),以获得以用户个性化的方式调适的音频信号(217;218;219;313;317;318;319;342)。

11.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为通过使用音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)和通过使用音频处理参数(120;262;362;462;562)由音频处理(220;320;420;520)提供的音频输出信号(218;219;313;318;319;342)的比较确定处理参数...

【技术特征摘要】
【国外来华专利技术】

1.一种用于根据至少一个音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)确定音频处理参数(120;262;362;462;562)的装置(100;200;300;400;500);

2.根据权利要求1所述的装置(100;200;300;400;500),其中装置被配置为根据由用户调整的用户参数(232;332;432,433;532)确定数据库(252;352;452;552),使得数据库的条目(252;352;452;552)描述由用户调整的用户参数(232;332;432,433;532)。

3.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为根据至少一个音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)确定数据库(252;352;452;552),使得数据库的条目(252;352;452;552)描述音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)。

4.根据权利要求3所述的装置(100;200;300;400;500),其中装置被配置为确定数据库(252;352;452;552),使得数据库(252;352;452;552)描述不同音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)和由用户调整的相应用户参数(232;332;432;433;532)之间的分配。

5.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为根据音频输出信号(218;219;313;318;319;342)确定数据库(252;352;452;552),使得数据库的条目(252;352;452;552)描述音频输出信号(218;219;313;318;319;342)。

6.根据权利要求5所述的装置(100;200;300;400;500),其中装置被配置为确定数据库(252;352;452;552),使得数据库(252;352;452;552)描述不同音频输出信号(218;219;313;318;319;342)和由用户调整的相应用户参数(232;332;432,433;532)之间的分配。

7.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为基于由装置获得的数据库(252;352;452;552)调适处理参数确定规则(140;250;350;450;550)的至少一个系数(142;256;356;456;556),以通过用户个性化方式调适处理参数确定规则(140;250;350;450;550),以获得以用户个性化的方式调适的音频处理参数(120;262;362;462;562)。

8.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为基于数据库(252;352;452;552)提供或调适处理参数确定规则(140;250;350;450;550)。

9.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为基于由用户更正和/或修改的至少一个音频处理参数(120;262;362;462;562)确定和/或调适处理参数确定规则(140;250;350;450;550)的适应至少一个系数(142;256;356;456;556)。

10.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为基于音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)和基于音频处理参数(120;262;362;462;562)执行音频处理(220;320;420;520),以获得以用户个性化的方式调适的音频信号(217;218;219;313;317;318;319;342)。

11.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为通过使用音频输入信号(110;112;212;214;216;311;316;411;416;512;514;516)和通过使用音频处理参数(120;262;362;462;562)由音频处理(220;320;420;520)提供的音频输出信号(218;219;313;318;319;342)的比较确定处理参数确定规则(140;250;350;450;550)的系数(142;256;356;456;556)。

12.根据上述权利要求中任何一个所述的装置(100;200;300;400;500),其中装置被配置为提供由用户调整的用户参数(23...

【专利技术属性】
技术研发人员:佩吉·西洛普托拜厄斯·布伦斯
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1