基于背景噪声的音频内容的自适应调制制造技术

技术编号:36594591 阅读:13 留言:0更新日期:2023-02-04 18:04
本文描述了能够基于背景噪声来自适应地调制音频内容的技术。例如,音频内容的响度和背景噪声的响度之间的响度差被确定。将音频内容的响度与上限响度阈值进行比较。基于该响度差和/或该比较来从多个调制中选择调制。使用所选调制来调制后续输出的音频内容。所选调制来调制后续输出的音频内容。所选调制来调制后续输出的音频内容。

【技术实现步骤摘要】
【国外来华专利技术】基于背景噪声的音频内容的自适应调制

技术介绍

[0001]音频内容通常具有响度的变化,其用于为音频内容的收听者提供气氛。随着音频内容的声音质量的提高,收听者可以感知到响度的较大变化。然而,在某些情况下,响度的大范围变化可能不是期望的或不可能。例如,如果收听者处于相当嘈杂的环境中,则收听者可能倾向于牺牲声音质量以便能够将音频内容与噪声区分开来。在另一个示例中,如果收听者正在观看一部电影,而孩子们在相邻房间里睡着了,则收听者可能倾向于保持尽可能低的音量,同时仍然能够听到电影的最安静的部分。
[0002]音频内容的响度可以被压缩或归一化以减小响度变化的幅度。传统上,用于响度压缩或归一化的参数在制造时对于设备是固定的,并且设备通常被配置成基于设备的总体音量设置(如果有的话)来改变响度压缩和归一化。在增加响度压缩或归一化与提高声音质量之间经常存在折衷。制造商通常不知道用户将使用设备的环境,因此无法针对这些环境精确调整用于响度压缩或归一化的参数。制造商通常使用广泛的假设来确定用于各种类型的设备的参数。例如,移动电话通常被配置用于相对较嘈杂的环境;然而,笔记本电脑通常被配置用于相对较安静的环境。

技术实现思路

[0003]用户经常观看或收听大量媒体。尽管用户通常想要增大媒体中音频内容的动态范围(例如,音频内容的最安静部分和最响亮部分之间的响度差),但用户可能遇到需要较小动态范围的情况。例如,用户可能有正在相邻房间里睡觉的小孩。在该示例中,用户可能期望音频内容具有相对较低的动态范围,以使得整个音频内容具有基本上相等的响度,并且音频内容的响亮部分和安静部分之间的响度差近似为零。如果用户在上述情况下减小提供音频内容的设备的动态范围,则在其他情况下由该设备提供的音频内容可能听起来沉闷且不令人兴奋,除非用户在这些情况下增大动态范围。可能期望设备在没有用户的手动输入的情况下改变音频内容的动态范围以适应各种情况。
[0004]本文描述了尤其用于基于(例如,至少部分地基于)背景噪声来自适应地调制音频内容的各种方法。音频内容可使用动态范围压缩和/或自动增益控制(AGC)来调制。动态范围压缩(也被称为压缩)是音频信号处理操作,该操作提高音频内容中的相对较安静的声音的响度和/或降低音频内容中的相对较响亮的声音的响度,这减小(即,压缩)音频内容的动态范围。向下压缩是以下方式的压缩:基于音频内容的第一部分中的每个声音的响度超过响度阈值而降低该第一部分中的每个声音的响度并且基于该音频内容的第二部分中的每个声音的响度不超过该响度阈值而不改变该第二子集中的每个声音的响度。向上压缩是以下方式的压缩:基于音频内容的第一部分中的每个声音的响度低于响度阈值而提高该第一部分中的每个声音的响度并且基于该音频内容的第二部分中的每个声音的响度不低于该响度阈值而不改变该第二子集中的每个声音的响度。AGC是一种闭环反馈技术,尽管输出所基于的输入处的信号幅度变化,但该技术在该输出处保持指定的信号幅度。
[0005]在一示例方法中,音频内容的响度和背景噪声的响度之间的响度差被确定。将音
频内容的响度与上限响度阈值进行比较。基于该响度差和/或该比较来从多个调制中选择调制。将根据响度差小于阈值差并且音频内容的响度小于上限响度阈值来选择第一调制。将根据响度差大于或等于阈值差并且音频内容的响度小于上限响度阈值来选择第二调制。将根据音频内容的响度大于或等于上限响度阈值来选择第三调制。使用所选调制来调制后续输出的音频内容。
[0006]提供本
技术实现思路
以便以简化的形式介绍以下在具体实施方式中还描述的概念的选集。本公开内容并不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。此外,注意到本专利技术不限于在具体实施方式和/或本文的其它章节中所述的特定实施例。本文呈现这些实施例仅用于说明性的用途。基于本文包含的示教,附加的实施例对相关领域的技术人员将是显而易见的。
附图说明
[0007]本文中所结合的并且形成说明书的一部分的附图解说了本专利技术的各实施例,并且还与本描述一起用于解释所涉及的原理以及使相关领域的技术人员能够实现和使用所公开的技术。
[0008]图1是根据一实施例的示例基于自适应调制的电子设备的框图。
[0009]图2是根据一实施例的图1所示的音频流的根据相应调制技术来调制的示例表示的标绘。
[0010]图3

6描绘了根据各实施例的用于基于背景噪声来自适应地调制音频内容的示例方法的流程图。
[0011]图7是根据一实施例的图1所示的自适应调制器的示例实现的框图。
[0012]图8是根据一实施例的示例性移动设备的系统图。
[0013]图9描绘其中可实现各实施例的示例计算机。
[0014]所公开的技术的特征和优点将通过以下结合附图时所阐述的详细描述而变得更显而易见,在附图中,类似的附图标记在整个说明书中标识对应元素。在附图中,相同的附图标记一般指示等同的、功能上类似的、和/或结构上类似的元素。其中元素第一次出现的附图由对应附图标记中最左侧的(诸)数位来指示。
具体实施方式
[0015]I.介绍
[0016]用户经常观看或收听大量媒体。尽管用户通常想要增大媒体中音频内容的动态范围(例如,音频内容的最安静部分和最响亮部分之间的响度差),但用户可能遇到需要较小动态范围的情况。例如,如果用户在相当嘈杂的环境中,用户可能希望减小音频内容的动态范围以使得用户能够在噪声之上听见音频内容的较安静的部分。如果用户在上述情况下减小提供音频内容的设备的动态范围,则在其他情况下由该设备提供的音频内容可能听起来沉闷且不令人兴奋,除非用户在这些情况下增大动态范围。可能期望设备在没有用户的手动输入的情况下改变音频内容的动态范围以适应各种情况。
[0017]II.示例实施例
[0018]本文描述的示例实施例能够基于(例如,至少部分地基于)背景噪声来自适应地调
制音频内容。音频内容可使用动态范围压缩来调制。动态范围压缩(也被称为压缩)是音频信号处理操作,该操作提高音频内容中的相对较安静的声音的响度和/或降低音频内容中的相对较响亮的声音的响度,这减小(即,压缩)音频内容的动态范围。向下压缩是以下方式的压缩:基于音频内容的第一部分中的每个声音的响度超过响度阈值而降低该第一部分中的每个声音的响度并且基于该音频内容的第二部分中的每个声音的响度不超过该响度阈值而不改变该第二子集中的每个声音的响度。向上压缩是以下方式的压缩:基于音频内容的第一部分中的每个声音的响度低于响度阈值而提高该第一部分中的每个声音的响度并且基于该音频内容的第二部分中的每个声音的响度不低于该响度阈值而不改变该第二子集中的每个声音的响度。
[0019]与用于调制音频内容的常规技术相比,本文描述的示例技术具有各种益处。例如,示例技术可以能够基于消费音频内容的情形(例如,环境)来自动适配对音频内容的调制(例如,压缩)。情形可以至少部分地基于在该情形中检测到的背景噪声(例如,背景噪声与音频内容之间的响度差)和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种电子设备,包括:被配置成输出音频内容的扬声器;被配置成接收背景噪声和所述音频内容的麦克风;以及耦合到所述扬声器和所述麦克风的控制器,所述控制器被配置成:确定所述音频内容的响度和所述背景噪声的响度之间的响度差;将所述音频内容的响度与上限响度阈值进行比较;基于所述响度差或所述比较中的至少一者来从多个调制中选择调制,其中第一调制将根据所述响度差小于阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,其中第二调制将根据所述响度差大于或等于所述阈值差并且所述音频内容的响度小于所述上限响度阈值来被选择,并且其中第三调制将根据所述音频内容的响度大于或等于所述上限响度阈值来被选择;以及使用所选调制来调制后续输出的音频内容。2.如权利要求1所述的电子设备,其中所述音频内容包括对应于多个相应频率的多个音频分量;其中所述第一调制被配置成将所述音频内容压缩超过上限阈值压缩量;其中所述第二调制被配置成将所述音频内容压缩小于下限阈值压缩量,所述下限阈值压缩量小于或等于所述上限阈值压缩量;并且其中所述第三调制被配置成基于所述音频分量的第一子集中的每个音频分量具有小于下限响度阈值的响度来提高所述第一子集的响度并且进一步基于所述音频分量的第二子集中的每个音频分量具有大于或等于所述下限响度阈值来降低所述第二子集的响度。3.如权利要求2所述的电子设备,其中所述第一调制被进一步配置成响应于所述音频内容被压缩,使用自动增益控制来将所述音频内容的响度改为基本上等于所述扬声器的通带中的指定频率范围中的目标响度。4.如权利要求2所述的电子设备,其中所述第二调制被配置成不在所述扬声器的通带中的指定频率范围内压缩所述音频内容。5.如权利要求2所述的电子设备,其中所述第三调制被配置成至少部分地基于所述音频分量的所述第二子集中的每一个音频分量具有大于或等于所述下限响度阈值的响度而不改变所述第二子集的响度。6.如权利要求1所述的电子设备,其中所述控制器被配置成:分析所述音频内容的音频简档,所述音频简档指示所述音频内容的标识所述音频内容的一个或多个音频属性;以及进一步基于由所述音频内容的所述音频简档指示的所述一个或多个音频属性来选择所述调制。7.如权利要求1所述的电子设备,其中所述控制器被配置成:分析所述音频内容的类型;以及进一步基于所述音频内容的类型来选择所述调制。8.如权利要求1所述的电子设备,其中所述控制器被配置成:
确定所述电子设备的类型;以及进一步基于所述电子设备的类型来选择所述调制。9.如权利要求1所述的电子设备,其中所述控制器被配置成:在与所述音频内容相关联的软件应用在使用时在多个时间段内周期性地对所述音频内容和所述背景噪声进行采样;以及对于所述多个时间段中的每一个时间段,确定所述响度差,将所述音频内容的响度与所述上限响度阈值进行比较,选择所述调制,以及调...

【专利技术属性】
技术研发人员:J
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1