用于音量调节的方法和装置制造方法及图纸

技术编号:26535984 阅读:16 留言:0更新日期:2020-12-01 14:28
本文公开了用于音量调节的装置、系统、制品和方法。一种示例方法包括以下步骤:对音频信号中表示的媒体进行识别;响应于识别到音频信号中的媒体,访问与该媒体相关联的元数据;基于元数据,确定媒体的平均音量;以及基于平均增益值调节音频信号的输出音量,该平均增益值是基于媒体的平均音量确定的。

【技术实现步骤摘要】
【国外来华专利技术】用于音量调节的方法和装置相关申请本专利要求于2018年1月7日提交的题为“METHODSANDAPPARATUSFORDYNAMICVOLUMEADJUSTMENT”的美国临时申请序列号No.62/614,439的权益和优先权。美国临时申请序列号No.62/614,439的全部内容通过引用并入于此。
本公开总体上涉及音量调节,并且更具体地涉及用于音量调节的方法和装置。
技术介绍
近年来,使用越来越多的渠道传送了大量具有时变特性的媒体。具体地,可以使用更传统的渠道(例如,无线电)或者使用最新开发的渠道(诸如,使用互联网连接流传输设备)来接收音频媒体。随着这些渠道的开发,也已经开发了能够对来自多个源的音频进行处理和输出的系统。例如,一些汽车媒体系统能够从光盘(CD)、蓝牙连接设备、通用串行总线(USB)连接设备、Wi-Fi连接设备、辅助输入端和其它源传送媒体。附图说明图1是根据本公开的教导构造的用于音量调节的示例系统的示意图。图2是示出了图1的媒体单元的附加细节的框图。图3是表示示例机器可读指令的流程图,所述示例机器可读指令可以用于实现图1和图2的执行音量调节的媒体单元106。图4是表示示例机器可读指令的流程图,所述示例机器可读指令可以用于实现图1和图2的输出音频信号并提供音频信号的实时音量调节的媒体单元106。图5是表示示例机器可读指令的流程图,所述示例机器可读指令可以用于实现图1和图2的执行音量调节从而使音量在源之间以及在媒体之间标准化的媒体单元106。图6是可以执行图3至图5的指令以实现图1和图2的示例媒体单元106的示例处理器平台的示意图。附图未按比例绘制。在任何可能的情况下,将在整个附图和所附书面描述中使用相同的附图标记来指代相同或相似的部分。具体实施方式在常规音频媒体实现中,与不同媒体相关联的音频信号可以具有不同音量。例如,一张CD上的媒体可以以与另一张CD的媒体显著不同的音量被记录和/或制作母版(master)。类似地,从流传输设备取回的媒体可以具有与从不同设备取回的媒体或经由不同应用从同一设备取回的媒体显著不同的音量水平。随着用户越来越多地收听来自各种不同源的媒体,源之间以及同一源的媒体之间的音量水平差会变得非常明显,并且可能引起收听者的不适。在一些用于音量调整的常规方法中,利用动态范围压缩器来压缩音频信号的总动态范围,以满足音量阈值。在一些常规实现中,这样的动态范围压缩持续地监测并调节音频信号的音量,以便满足音频信号的音量阈值。这样的持续调节会影响收听者对音频信号的感知,因为曲目(track)的原始动态会被显著更改。在一些示例中,动态范围压缩显著降低了感知的音频信号质量。在本文公开的示例方法、装置、系统和制品中,使用媒体元数据来确定媒体单元(例如,歌曲、曲目等)的平均音频水平。然后,利用平均音频水平来确定适当的增益值,以应用于音频信号,从而实现期望音量水平(在本文也称为目标音量水平)。在一些示例中,在所有音频信号中保持期望音量水平,使得所有信号以一致的平均音量水平输出,以实现最佳用户体验。此外,在一些示例中,在音频信号的输出期间,以规则的增量(increment)监测音量水平,以确定片段的音量水平是否具有满足音量阈值的平均音量。在这样的示例中,可以考虑片段期间的音量与期望音量水平之间的差而再次动态地调节音量。此外,针对已被更改成或调节成使得音量水平不再与媒体中表示的音量水平相同的媒体,以规则的增量进行监测将基于元数据防止不正确的增益将音频信号的音量调节到期望范围之外。在本文公开的示例方法、装置、系统和制品中,可以调节音量水平以确保音量保持在安全收听音量范围内。例如,如果对相对安静的曲目进行扩音(amplify),然后播放转换到已经具有很高音量的曲目,则将需要调节音量水平,以避免以危险的音量水平(例如,可能损坏人的听力或相对快速地渲染设备的音量水平)播放新曲目。在本文公开的一些示例中,采用缓冲(例如,一秒缓冲、三秒缓冲等)充当从源(例如,光盘、无线电站、移动电话等)输入音频信号的时间与输出该音频信号的时间之间的延迟,从而防止了音量水平的迅速波动,并使得能够在缓冲时段期间对音量水平进行分析和调节。在本文公开的一些示例技术中,利用音频水印来标识媒体,以便取回与音频信号有关的元数据。音频水印是一种用于对媒体(诸如,电视广播、无线电广播、广告(电视和/或收音机)、下载的媒体、流传输媒体、预包装的媒体等)进行标识的技术。现有的音频水印技术通过将诸如媒体标识信息和/或可以映射到媒体标识信息的标识符的一个或更多个音频代码(例如,一个或更多个水印)嵌入到音频分量和/或视频分量中来标识媒体。在一些示例中,音频分量或视频分量被选择成具有足以隐藏水印的信号特性。如本文所使用的,术语“代码”或“水印”可互换使用,并且被定义成表示可以插入或嵌入在媒体(例如,节目或广告)的音频或视频中的任何标识信息(例如,标识符),以用于标识媒体的目的或用于诸如调音(例如,标识报头的分组)的另一目的。如本文所使用的,“媒体”是指音频和/或视觉(静止或移动)的内容和/或广告。为了识别采用指纹的媒体,水印被提取并用于访问被映射到媒体标识信息的参考水印表。在本文公开的一些示例技术中,利用音频指纹来标识媒体,以便取回与音频信号有关的元数据。音频指纹识别是一种用于对媒体(诸如,电视广播、无线电广播、广告(电视和/或收音机)、下载的媒体、流传输媒体、预包装的媒体等)进行标识的技术。与基于被包括在和/或被嵌入在被监测媒体中的代码和/或水印的媒体监测技术不同,基于指纹或签名的媒体监测技术通常在监测时间间隔期间使用被监测媒体的一个或更多个固有特性来生成该媒体的基本唯一的代理。这样的代理被称为签名或指纹,并且可以采取表示媒体信号(例如,形成正被监测的媒体呈现的音频信号和/或视频信号)的任何方面的任何形式(例如,一系列数字值、波形等)。签名可以是在计时器间隔内连续收集的一系列签名。当处理同一媒体呈现时,良好的签名是可重复的,但是相对于其它(例如,不同)媒体的其它(例如,不同)呈现而言是唯一的。因此,术语“指纹”和“签名”在本文中可互换使用,并且在本文中定义为表示用于对根据媒体的一个或更多个固有特性生成的媒体进行标识的代理。基于签名的媒体监测通常涉及确定(例如,生成和/或收集)表示由被监测媒体设备输出的媒体信号(例如,音频信号和/或视频信号)的签名,并将被监测签名与对应于已知(例如,参考)媒体源的一个或更多个参考签名进行比较。可以评估各种比较准则(诸如,互相关值、汉明距离等),以确定被监测签名是否与特定参考签名匹配。当找到被监测签名与参考签名中的一个参考签名之间的匹配时,可以将被监测媒体识别为对应于由与被监测签名匹配的参考签名表示的特定参考媒体。因为针对参考签名收集了属性(诸如,媒体的标识符、呈现时间、广播频道等),所以这些属性然后可以与被监测媒体相关联,所述被监测媒体的被监测签名与参考签名匹配。在本文公开的一些示例技术中,通过文本匹本文档来自技高网...

【技术保护点】
1.一种调节音频音量的装置,所述装置包括:/n音频信号识别器,所述音频信号识别器用于对音频信号中表示的媒体进行识别;/n元数据访问器,所述元数据访问器用于:/n响应于识别到所述音频信号中的所述媒体,访问与所述媒体相关联的元数据;并且/n基于所述元数据,确定所述媒体的平均音量;以及/n音量调节器,所述音量调节器用于基于平均增益值调节所述音频信号的输出音量,所述平均增益值是基于所述媒体的所述平均音量确定的。/n

【技术特征摘要】
【国外来华专利技术】20180107 US 62/614,4391.一种调节音频音量的装置,所述装置包括:
音频信号识别器,所述音频信号识别器用于对音频信号中表示的媒体进行识别;
元数据访问器,所述元数据访问器用于:
响应于识别到所述音频信号中的所述媒体,访问与所述媒体相关联的元数据;并且
基于所述元数据,确定所述媒体的平均音量;以及
音量调节器,所述音量调节器用于基于平均增益值调节所述音频信号的输出音量,所述平均增益值是基于所述媒体的所述平均音量确定的。


2.根据权利要求1所述的装置,所述装置还包括实时音频监测器,所述实时音频监测器用于确定所述音频信号的样本的平均测量音量与指定时间跨度的期望音量水平之间的差,其中,所述音量调节器基于第二增益值调节所述音频信号的所述音量,所述第二增益值是基于所述差的。


3.根据权利要求2所述的装置,其中,所述平均增益值是被应用于所述音频信号的初始音量调节,而所述第二增益值是被应用于所述音频信号的后续音量调节。


4.根据权利要求1所述的装置,所述装置还包括动态范围压缩器,所述动态范围压缩器用于在所述音频信号识别器无法识别到所述音频信号中表示的媒体时压缩所述音频信号。


5.根据权利要求1所述的装置,所述装置还包括音频信号访问器,所述音频信号访问器用于缓冲所述音频信号,所述缓冲引起输出所述音频信号的延迟,以提供用于识别所述媒体、访问所述元数据和确定所述平均音量的时间。


6.根据权利要求1所述的装置,其中,所述平均增益值是基于安全收听音量范围确定的。


7.根据权利要求1所述的装置,其中,所述平均增益值是基于所述音频信号的源类型的历史音量设置确定的。


8.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括计算机可读指令,所述计算机可读指令在被执行时使处理器至少执行以下操作:
对音频信号中表示的媒体进行识别;
响应于识别到所述音频信号中的所述媒体,访问与所述媒体相关联的元数据;
基于所述元数据,确定所述媒体的平均音量;以及
基于平均增益值调节所述音频信号的输出音量,所述平均增益值是基于所述媒体的所述平均音量确定的。


9.根据权利要求8所述的非暂时性计算机可读存储介质,其中,所述计算机可读指令在被执行时使所述处理器执行以下操作:
确定所述音频信号的样本的平均测量音量与指定时间跨度的期望...

【专利技术属性】
技术研发人员:R·库弗J·斯科特M·K·克里默A·瓦尔塔卡维
申请(专利权)人:格雷斯诺特有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1