当前位置: 首页 > 专利查询>索尼公司专利>正文

信息处理设备和方法以及程序技术

技术编号:21374736 阅读:30 留言:0更新日期:2019-06-15 12:27
本技术涉及使得能够有效地校正音量以更好地匹配听感特性的信息处理设备、方法和程序。本发明专利技术被配置成获取作为音频信号组的每个音频信号的元数据的统计值的目标数据,获取要再现的音频信号的元数据,以及通过使用所获取的目标数据和元数据来计算要再现的音频信号的音量的校正值或要再现的音频信号的音质的校正值或两者。本发明专利技术可以应用于例如信息处理设备、电子设备、计算机、服务器、程序、存储介质和系统。

Information processing equipment and methods and procedures

The technology relates to information processing devices, methods and programs that enable effective volume correction to better match auditory characteristics. The present invention is configured to acquire target data as the statistical value of metadata of each audio signal as an audio signal group, to acquire metadata of the audio signal to be reproduced, and to calculate the corrected value of the volume of the audio signal to be reproduced or the corrected value of the quality of the audio signal to be reproduced or both by using the acquired target data and metadata. The invention can be applied to, for example, information processing equipment, electronic equipment, computer, server, program, storage medium and system.

【技术实现步骤摘要】
【国外来华专利技术】信息处理设备和方法以及程序
本技术涉及信息处理设备、信息处理方法和程序,并且更具体地,涉及能够获得更适合于听感特性的音量校正效果的信息处理设备、信息处理方法和程序。
技术介绍
过去,在不同音频源(在音乐的情况下是音乐作品)之间调平音量(响度)并改善收听者的舒适性和便利性(例如,消除针对每个音乐作品调节音量的不便等)的技术已经开发并且投入实际使用(例如,参见专利文献1至3)。例如,在已知的相关技术中,使用整个音乐作品的有效值来计算音量校正值。此外,在这种情况下,使用预滤波器来改善听感特性与有效值之间的相关性。作为预滤波器的特性,例如,经常使用K特性等。引用列表专利文献专利文献1:JP4981123B专利文献2:JP5101292B专利文献3:JP2016-509693T
技术实现思路
技术问题然而,在相关技术中,可能难以使音量校正效果与用户的听感特性相匹配。例如,在使用K特性作为预滤波器的特性的情况下,考虑到滤波器的简单实现,通过两个双二阶滤波器的级联连接来实现K特性,并且不必然严格地反映听觉特性。因此,可能难以执行准确反映用户的听感特性的音量校正。此外,即使使用具有不妥协特性的预滤波器来严格地再现听觉特性,在再现设备的频率特性不平坦的情况下,由于如下原因,其可能难以获得与用户的听感特性相匹配的音量校正效果:原则上它不会变成由收听者最终感知的真实有效值,除非在考虑特性的情况下计算有效值。鉴于前述内容提出了本技术,并且本技术的目的是获得更适合于听感特性的音量校正效果。问题的解决方案本技术的一个方面的信息处理设备是如下信息处理设备,该信息处理设备包括:目标数据获取单元,其被配置成获取目标数据,该目标数据是音频信号组的每个音频信号的元数据的统计值;元数据获取单元,其被配置成获取再现目标的音频信号的元数据;以及校正值计算单元,其被配置成使用由目标数据获取单元获取的目标数据和由元数据获取单元获取的元数据来计算再现目标的音频信号的音量的校正值和再现目标的音频信号的音质的校正值中的任一者或两者。元数据可以包括音频信号的功率谱密度和音频信号的样本值的绝对值直方图。目标数据可以包括功率谱密度的平均值和标准偏差值以及绝对值直方图的平均值和标准偏差值。校正值计算单元可以使用再现目标的音频信号的样本值的绝对值直方图和音频信号组的样本值的绝对值直方图的平均值来计算音量的校正值。校正值计算单元可以使用再现目标的音频信号的样本值的绝对值直方图的基准峰值水平和模式值以及音频信号组的样本值的绝对值直方图的平均值的基准峰值水平和模式值来计算音量的校正值。校正值计算单元可以使用再现目标的音频信号的样本值的绝对值直方图对再现目标的音频信号的功率谱密度进行规范化,并且使用规范化的功率谱密度来计算音质的校正值。校正值计算单元可以利用具有再现目标的音频信号的样本值的绝对值直方图的预定概率密度的值对再现目标的音频信号的功率谱密度进行规范化。校正值计算单元可以使用再现目标的音频信号的样本值的绝对值直方图的基准峰值水平对再现目标的音频信号的功率谱密度进行规范化。校正值计算单元可以获得再现目标的音频信号的规范化的功率谱密度与音频信号组的功率谱密度的平均值之间的差异,并且使用该差异来计算音质的校正值。校正值计算单元可以使用上述差异和音频信号组的功率谱密度的标准偏差值来计算再现目标的音频信号的功率谱密度的校正值,并且使用再现目标的音频信号的功率谱密度的校正值来计算音质的校正值。还可以包括校正单元,该校正单元被配置成使用由校正值计算单元计算的校正值来校正再现目标的音频信号的音量和音质中的任一者或两者。还可以包括加工部,该加工部被配置成在不使用由校正值计算单元计算的校正值的情况下对再现目标的音频信号的音质进行加工。还可以包括输出单元,该输出单元被配置成再现和输出再现目标的音频信号。还可以包括元数据生成单元,该元数据生成单元被配置成生成音频信号的元数据。元数据生成单元可以通过频率稀疏来生成元数据。元数据生成单元可以生成再现目标的音频信号的元数据,并且校正值计算单元可以被配置成使用由元数据生成单元生成的元数据来计算再现目标的音频信号的音量的校正值和再现目标的音频信号的音质的校正值中的任一者或两者。元数据生成单元可以被配置成生成音频信号组的每个音频信号的元数据,并且还可以包括目标数据生成单元,该目标数据生成单元被配置成使用由元数据生成单元生成的音频信号组的每个音频信号的元数据来生成音频信号组的目标数据。还可以包括数据库,该数据库被配置成管理由目标数据生成单元生成的目标数据。本技术的一个方面的信息处理方法是如下信息处理方法,该信息处理方法包括:获取目标数据,该目标数据是音频信号组的每个音频信号的元数据的统计值;获取再现目标的音频信号的元数据;以及使用所获取的目标数据和所获取的元数据来计算再现目标的音频信号的音量的校正值和再现目标的音频信号的音质的校正值中的任一者或两者。本技术的一个方面的程序是使得计算机用作以下的程序:目标数据获取单元,其被配置成获取目标数据,该目标数据是音频信号组的每个音频信号的元数据的统计值;元数据获取单元,其被配置成获取再现目标的音频信号的元数据;以及校正值计算单元,其被配置成使用由目标数据获取单元获取的目标数据和由元数据获取单元获取的元数据来计算再现目标的音频信号的音量的校正值和再现目标的音频信号的音质的校正值中的任一者或两者。在本技术的一个方面,获取作为音频信号组的每个音频信号的元数据的统计值的目标数据,获取再现目标的音频信号的元数据,以及使用所获取的目标数据和所获取的元数据来计算再现目标的音频信号的音量的校正值和再现目标的音频信号的音质的校正值中的任一者或两者。专利技术的有益效果根据本技术,可以对信息进行处理。此外,根据本技术,可以获得更适合于听感特性的音量校正效果。附图说明[图1]图1是示出音频信号再现系统的主要配置示例的框图。[图2]图2是示出目标数据提供服务器的主要配置示例的框图。[图3]图3是示出目标数据提供服务器的主要功能示例的功能框图。[图4]图4是示出音频源分析单元的主要配置示例的功能框图。[图5]图5是示出规范化单元的主要配置示例的功能框图。[图6]图6是示出统计分析单元的主要配置示例的功能框图。[图7]图7是示出用作统计分析目标的音频信号组的PSD的示例的图。[图8]图8是示出用作统计分析目标的音频信号组的HIST的示例的图。[图9]图9是示出PSD的平均值和标准偏差值的示例的图。[图10]图10是示出HIST的平均值和标准偏差值的示例的图。[图11]图11是示出1990年制作的音乐作品的音频信号波形、PSD和HIST的示例的图。[图12]图12是示出2012年制作的音乐作品的音频信号波形、PSD和HIST的示例的图。[图13]图13是示出1990年制作的音乐作品的HIST(横轴线性)的示例的图。[图14]图14是示出2012年制作的音乐作品的HIST(横轴线性)的示例的图。[图15]图15是示出在没有规范化的情况下的统计处理结果的示例的图。[图16]图16是示出在利用最大值(P=0.0)执行规范化的情况下PSD的统计处理结果的示例的图。[图17]图17是示出在利用最大值(P=0.0001)执行规范化的情况下PSD的统计本文档来自技高网...

【技术保护点】
1.一种信息处理设备,包括:目标数据获取单元,其被配置成获取目标数据,所述目标数据是音频信号组的每个音频信号的元数据的统计值;元数据获取单元,其被配置成获取再现目标的音频信号的元数据;以及校正值计算单元,其被配置成使用由所述目标数据获取单元获取的所述目标数据和由所述元数据获取单元获取的所述元数据来计算所述再现目标的音频信号的音量的校正值和所述再现目标的音频信号的音质的校正值中的任一者或两者。

【技术特征摘要】
【国外来华专利技术】2016.10.07 JP 2016-1987491.一种信息处理设备,包括:目标数据获取单元,其被配置成获取目标数据,所述目标数据是音频信号组的每个音频信号的元数据的统计值;元数据获取单元,其被配置成获取再现目标的音频信号的元数据;以及校正值计算单元,其被配置成使用由所述目标数据获取单元获取的所述目标数据和由所述元数据获取单元获取的所述元数据来计算所述再现目标的音频信号的音量的校正值和所述再现目标的音频信号的音质的校正值中的任一者或两者。2.根据权利要求1所述的信息处理设备,其中,所述元数据是所述音频信号的功率谱密度和所述音频信号的样本值的绝对值直方图。3.根据权利要求2所述的信息处理设备,其中,所述目标数据是所述功率谱密度的平均值和标准偏差值以及所述绝对值直方图的平均值和标准偏差值。4.根据权利要求3所述的信息处理设备,其中,所述校正值计算单元使用所述再现目标的音频信号的样本值的所述绝对值直方图和所述音频信号组的样本值的所述绝对值直方图的平均值来计算所述音量的校正值。5.根据权利要求4所述的信息处理设备,其中,所述校正值计算单元使用所述再现目标的音频信号的样本值的所述绝对值直方图的基准峰值水平和模式值以及所述音频信号组的样本值的所述绝对值直方图的平均值的基准峰值水平和模式值来计算所述音量的校正值。6.根据权利要求3所述的信息处理设备,其中,所述校正值计算单元:使用所述再现目标的音频信号的样本值的所述绝对值直方图对所述再现目标的音频信号的所述功率谱密度进行规范化,以及使用经规范化的所述功率谱密度来计算所述音质的校正值。7.根据权利要求6所述的信息处理设备,其中,所述校正值计算单元利用具有所述再现目标的音频信号的样本值的所述绝对值直方图的预定概率密度的值对所述再现目标的音频信号的所述功率谱密度进行规范化。8.根据权利要求7所述的信息处理设备,其中,所述校正值计算单元使用所述再现目标的音频信号的样本值的所述绝对值直方图的基准峰值水平对所述再现目标的音频信号的所述功率谱密度进行规范化。9.根据权利要求6所述的信息处理设备,其中,所述校正值计算单元:获得经规范化的所述再现目标的音频信号的所述功率谱密度与所述音频信号组的所述功率谱密度的平均值之间的差异,以及使用所述差异计算所述音质的校正值。10.根据权利要求9所述的信息处理设备,其中,所述校正值计算单元:使用所述差异和所述音频信号组的所述功率谱密度的标准偏...

【专利技术属性】
技术研发人员:土田祐司
申请(专利权)人:索尼公司
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1