用于改善的音频感知的系统和方法技术方案

技术编号:17103434 阅读:26 留言:0更新日期:2018-01-21 13:02
本发明专利技术描述了用于最佳地收听音乐的音频信号个性化增强的方法。在音频装置中联合地实施听力测试、音频信号补偿和信号处理算法的组合。在可听频率的整个范围内对音频信号进行处理和调谐,以针对收听装置的特性以及收听者的特定听力特性两者进行主动补偿,从而得到改善得多的音乐收听体验。在跨越可听频谱的多个频率上,在预选的动态音量范围内,使用随机化的自测试算法来分析用户的每只耳朵的听力能力。

Systems and methods for improved audio perception

The present invention describes a method for personalized audio signal enhancement for listening to music. The combination of audio testing, audio signal compensation and signal processing algorithms is implemented in the audio device. The audio signal is processed and tuned in the whole range of audible frequency, in order to compensate for the characteristics of the listening device and the specific listening characteristics of the listener, so as to get much improved music listening experience. A randomized self test algorithm is used to analyze the user's auditory ability in every frequency over the audible spectrum, in the preselected dynamic volume range.

【技术实现步骤摘要】
【国外来华专利技术】用于改善的音频感知的系统和方法相关申请本申请要求2015年3月20日提交的美国临时专利申请No.62/177631的优先权权益,通过引用将其公开内容全文并入本文。
本专利技术属于音频信号处理的
,并且更具体而言,涉及对音频信号进行处理,以补偿用户听力的听力变化。
技术介绍
听力图是显示由听力计测量的针对标准化频率的可听阈值的图表。Y轴表示以分贝为单位测量的强度,并且X轴表示以赫兹为单位测量的频率。听力的阈值是相对于表示“正常”听力的标准化曲线以dB(HL)来绘制的。可以通过使用行为听力测试或者生理测试找到人或其它动物的听力阈值。可以使用被称为测听术的行为听力测试来获得听力图。对于人类而言,所述测试涉及以特定频率(音高)和强度(响度)呈现的不同音调。在人听到所述声音时,他们举手或者按下按钮,以使测试者知道他们已经听到了该声音。记录他们能够听到的最低强度的声音。理想地,听力图将显示直线,但是在实践当中每个人稍有不同,并且小的变化被认为是正常的。较大的变化(尤其是标准以下的)可以指示听力损伤,听力损伤可能在某种程度上随着年龄的增大而发生,但是有可能由于长期暴露于相当高的噪声水平下而恶化,例如,由于生活在机场或者交通繁忙的道路附近,由于工作关系而暴露于高噪声下,或者由于短时间内暴露于非常高的声音水平(例如暴露于射击或者很响的乐队或俱乐部和酒吧中的音乐)下。听力损伤也可能是某些疾病(例如,CMV或Ménière's症)的后果,并且可以从听力图的形状对这些疾病做出诊断。除了听力损伤之外,即使最贵的扬声器或个人收听装置,例如,具有近乎完美的动态特性和谱频率特性的高保真立体声耳机也将因个体的不同而产生相差悬殊的结果,具体取决于这些人各自的听力能力。现有的放大器或媒体播放器未被配备为提供针对收听者的特定听力限制而进行补偿的收听体验。用户通常只能调整播放装置的低频和高频信号水平(即,低音和高音控制),并且在更完善的播放器中,可以使用简单的均衡器根据收听者的个人品味和主观“感受”来重塑音频信号。上述方法中的任何方法都存在若干关键性的缺陷。一般而言,用户不知道如何调节每个控制,因为用户不知道他/她的听力特性的细节。尽管听力灵敏度往往仅在高频或低频下开始降低,但是在所有年龄段的人群当中缺口(窄频谱范围内的灵敏度损失)和两耳的不均等听力特性都是相当常见的。在图1的听力图中示出了这种听力特性的示例,该听力图示出了左右全频谱听力曲线(hearingprofile)。在图1的示图中,能够容易地识别出被绘制为以KHz计量的测试信号频率(X轴)的函数的以dB计量的灵敏度损失(Y轴)。此外,播放装置中的现有技术均衡器的调整范围在频率范围、可调整带的数量和宽度以及音量水平方面是非常有限的。类似地,现有技术播放装置除了使用平衡功能和音量的相对(左右声道)调整之外不允许对每只耳朵进行专用设置。尽管常用的声音均衡器能够在一定程度上补偿一些听力灵敏度损失,但是即使通过高质量耳机用播放装置听音乐也可能给具有听力限制的用户带来不满和挫折的情况也是真是存在的。为了补偿降低的听仪器声和人声的能力(往往处于窄频谱范围内或者部分地在一只耳朵内),很多消费者以大大提高的音量听音乐,这无意中产生了进一步导致听力下降的风险。仅抵抗受影响的频带内的特定听力限制的音频信号的个性化频谱补偿提供了一种更加有效并且安全的方案来处理中等的听力下降,并得到极大改善的听力体验。在各种医学研究(例如,“ScreeningandManagementofAdultHearingLossinPrimaryCare”,ScientificReview,TheJournaloftheAmericanMedicalAssociation,BevanYueh等人,2003;289(15):1976-1985)中很好地论述了人的听力能力随着年龄的增长而逐渐下降。值得注意的是,大多数35岁及以上的人表现出了一定程度的自然听力下降,其可能引起对音乐的欣赏减弱。此外,最近的研究(例如,TheJournalofTheAmericanMedicalAssociation,Vol.304,No.7,2010)表明在美国每五个十几岁的青少年中就有一个患有听力下降,其被认为是由个人播放装置的激增和不适当使用所引起的。个人的听力能力可能因很多变量而发生变化,包括听力阈值和噪声环境、对特定声音的灵敏度、对大声信号的动态响应、听力损伤的物理性质、以及诸如声音背景等心理-声学因素。听力损失机制可能是传导的(由外耳或中耳中的问题引起)、感觉神经的(由耳蜗中的问题引起)、或者由听神经或者大脑的听觉通路/皮层中的问题所引起的神经性的。在很多听力损害情况下,量身定制的助听器往往是最佳解决方案。选择助听器的过程要求使用复杂的设备和受到过高度培训的人员在听力专家办公室内进行详细的测试。在典型的听力图中,使用受限的四到八个基本频带来测量听力灵敏度响应,其重点在于在噪声环境下理解人类语言。从背景中过滤掉噪声和/或有选择地放大感兴趣的信号对于助听器设计而言具有根本的重要性。因此,助听器一般擅长对重点在对应于人类语音的3KHz-4KHz频带上的相对窄的频率范围进行矫正,而平均的人类听觉范围从20Hz延伸至16KHz以上。此外,助听器装置与播放装置存在固有的区别,因为它们被构建为在开放环境中使用,而不能与耳机或听筒一起使用用来听音乐。Internet的出现为各种在线听力测试以及考虑个人听力曲线的个性化技术的发展开放了可能性。近年来已经提供了很多测试体系和方法,然而,很少能够成功地提供可以在日常使用中的常见播放装置中实际实施的有效的自动化声音个性化。在当今的播放装置中常用的各种声音增强和补偿方法包括被动噪声衰减、对感兴趣信号的选择性放大、统计性信号滤波、自动增益控制(AGC)、主动噪声消除、或其任何组合。在Pavlovic等人的最近专利(美国专利No.8112166)中,作者总结出本领域的工作尚未成功地提供用于有效并且快速地生成个人听力曲线的系统,摘引如下:“对个人听力曲线的最普遍的使用仍然停留在助听器领域,在该领域中一定程度的听力损伤使得介入成为必要的”。在另一个专利示例(美国专利No.6944474和No.7529545)中,Rader等人尝试了基于个人的听力曲线、个人偏好和环境噪声因素来使音频信号个性化的方法。在该示例中,例如包括控制电路和逻辑的智能电话等个人通信装置用于使用从标准的年龄相关的外部存储听力曲线得到的参数对音频信号应用多频带压缩。在该方案中,还基于个人的耳朵的感知灵敏度来调整信号效果。然而,专利技术人并未教导测量听力损伤的确切方法,也没有解释如何使用由于给定频率上的损伤而导致的提高的可听度阈值来修改专利中提出的全频动态压缩(FFDC)算法和对应的自动增益控制(AGC)。作者渴求通过对声音进行压缩以使音频信号在听觉系统中不再失真来复制健康耳蜗的功能。已经在单耳蓝牙收听装置中提出该方案,单耳蓝牙收听装置通常不用来听音乐。在另一组专利公开文献(US2014/0334644A1、US2014/0309549A1和US2014/0314261A1中,Selig等人描述了几种“用于增强听力的方法”。在一种变型中,移动装置在其本文档来自技高网...
用于改善的音频感知的系统和方法

【技术保护点】
一种用于调整针对用户进行个性化的音频播放器的均衡的计算机实现的方法,包括:执行动态范围计算,以针对多个预定频率确定所述用户的动态听力范围;执行听力数据计算,以针对所述用户的每只耳朵单独地确定所述多个预定频率中的每者的上端水平和下端水平;使用所述听力数据计算的输出来调整音频播放器的均衡,以获得用户量身定制的均衡;以及在向所述用户播放所述音频文件之前将所述用户量身定制的均衡应用于音频信号。

【技术特征摘要】
【国外来华专利技术】2015.03.20 US 62/177,631;2015.12.22 US 14/979,2381.一种用于调整针对用户进行个性化的音频播放器的均衡的计算机实现的方法,包括:执行动态范围计算,以针对多个预定频率确定所述用户的动态听力范围;执行听力数据计算,以针对所述用户的每只耳朵单独地确定所述多个预定频率中的每者的上端水平和下端水平;使用所述听力数据计算的输出来调整音频播放器的均衡,以获得用户量身定制的均衡;以及在向所述用户播放所述音频文件之前将所述用户量身定制的均衡应用于音频信号。2.根据权利要求1所述的方法,还包括将压缩因子应用于所述量身定制的均衡,由此减小所述量身定制的均衡的所述动态范围。3.根据权利要求1所述的方法,其中,执行动态范围计算包括:针对每只耳朵单独地获得指示所述用户能够听到所述多个预定频率的音量水平以及所述用户不再能够听到所述多个预定频率的音量水平的用户输入。4.根据权利要求3所述的方法,其中,在获得所述用户的输入之前,在所述用户的耳朵中发出所述多个预定频率的声音作为一系列音调。5.根据权利要求4所述的方法,其中,所述一系列音调排除了来自所述用户能够听到的第一个倍频程和最后一个倍频程的频率。6.根据权利要求1所述的方法,其中,执行听力数据计算包括:针对所述多个预定频率中的每者确定初始最高水平和初始最低水平,以及使用用户的输入来使针对所述多个预定频率中的每者的每个最高水平与其对应的最低水平之间的跨距最小化。7.根据权利要求6所述的方法,其中,当所述多个预定频率中的一个频率的最高水平与其对应的最低水平之间的最小化的跨距达到了预设阈值时,为所述多个预定频率中的所述频率指定听力阈值水平。8.根据权利要求7所述的方法,其中,将所述听力阈值水平计算为最高水平与其对应的最低水平之间的最小化的跨距的中点。9.根据权利要求7所述的方法,还包括将压缩因子应用于所述量身定制的均衡,其中,将所述压缩因子计算为所述最高水平中的最高的一个与所述最低水平中的最低的一个之间的跨距乘以零和一之间的乘数。10.根据权利要求1所述的方法,其中,调整音频播放器的均衡包括使用所述听力数据计算来修改有限脉冲响应滤波器的系数。11.根据权利要求1所述的方法,其中,将所述用户量身定制的均衡应用于音频信号包括将单独的均衡应用于左耳声道和右耳声道。12.一种用于调整针对用户进行个性化的音频播放器的均衡的方法,包括:生成具有不同频率的一系列多个音调;执行下述操作至少一次:在所述用户的一只耳朵中发出所述系列的声音,并且请求来自所述用户的指示是否听到全部所述多个...

【专利技术属性】
技术研发人员:Y·拉茨
申请(专利权)人:因诺沃IP有限责任公司
类型:发明
国别省市:美国,US

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1