音频信号处理制造技术

技术编号:12021899 阅读:98 留言:0更新日期:2015-09-09 18:56
本发明专利技术的实施例涉及音频信号处理。提供一种用于音频信号处理的方法。该方法包括:获取与目标用户对音频信号的使用相关联的第一组元数据;获取与一组参考用户相关联的第二组元数据;以及至少部分地基于所述第一组元数据和所述第二组元数据,针对所述目标用户而生成至少一个参数的推荐配置,所述至少一个参数将被用于所述音频信号的所述使用。还公开了相应的装置和计算机程序产品。

【技术实现步骤摘要】

本专利技术总体上涉及音频信号处理,更具体地,涉及用于音频信号处理的混合式推荐的方法和装置。
技术介绍
当流式播放在线音频和/或在本地设备上回放音频时,通常需要应用某些后处理或者声效。例如,应用于音频信号的音频处理可以包括但不限于:噪声降低和补偿,均衡,音量调节、双声道虚拟化、环境提取、同步,等等。传统的音频处理向音频信号应用一组预定义参数。将会理解,预定义的参数只能够提供有限的生效,可能无法满足个体用户的需求。而且,某些预定义参数被硬编码到设备中,因此无法适配于所处理的音频信号和/或其他动态因素。为了解决这一问题,某些已知的解决方案支持在回放设备上的实时分析和处理,例如音量调节等。然而,本地回放设备、特别是那些便携式用户终端的处理能力和/或资源(诸如存储器)通常有限,这限制了复杂处理和算法的使用。而且,为了满足实时在线处理的低延迟要求,对音频信号处理的精度和质量不得不做出折中。已经提出了某些方案支持动态地适配音频处理算法的配置,例如,根据所处理的音频内容来适配。作为示例,可以使用分类算法将音频内容划分为不同的内容类别,诸如语音、音乐、电影,等等。继而,可以根据所处理音频的内容类别来控制音频处理,从而选择最为适当的参数值。然而,在这种已知方案中,仅仅使用了被处理的音频内容来配置音频处理算法,没有考虑关于设备、环境或者目标用户的行为等信息,而没有考虑到其他相关用户的特性。因此,所推荐的参数配置往往不是最优的。有鉴于此,本领域中需要一种支持对音频信号处理的配置进行更加准确和自适应的配置的技术方案。
技术实现思路
为了解决上述问题,本专利技术提出一种用于音频信号处理的方法和装置。在一个方面,本专利技术的实施例提供一种用于音频信号处理的方法。所述方法包括:获取与目标用户对音频信号的使用相关联的第一组元数据;获取与一组参考用户相关联的第二组元数据;以及至少部分地基于所述第一组元数据和所述第二组元数据,针对所述目标用户而生成至少一个参数的推荐配置,所述至少一个参数将被用于所述音频信号的所述使用。这方面的实施例还包括对应的计算机程序产品。在另一方面,本专利技术的实施例提供一种用于音频信号处理的装置。所述装置包括:第一元数据获取单元,被配置为获取与目标用户对音频信号的使用相关联的第一组元数据;第二元数据获取单元,被配置为获取与一组参考用户相关联的第二组元数据;以及配置推荐单元,被配置为至少部分地基于所述第一组元数据和所述第二组元数据,针对所述目标用户而生成至少一个参数的推荐配置,所述至少一个参数将被用于所述音频信号的所述使用。通过下文描述将会理解,根据本专利技术的实施例,基于内容的推荐和基于用户数据的推荐被整合在一起,以生成用于处理音频信号的一个或多个参数的推荐配置。通过将其他用户的行为纳入考虑,配置推荐可以更快地收敛至用户期望。同时,通过使用关于音频内容、设备、环境和/或用户偏好的信息,即使在缺乏足够用户数据的情况下也可以做出比较准确和可靠的推荐。【附图说明】通过参考附图阅读下文的详细描述,本专利技术实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例而非限制性的方式示出了本专利技术的若干实施例,其中:图1示出了本专利技术的示例实施例可实现于其中的系统的框图;图2示出了根据本专利技术的示例实施例的用于音频信号处理的方法的流程图;图3示出了根据本专利技术的示例实施例的用于获取与参考用户相关联的元数据的方法的流程图;图4示出了根据本专利技术的示例实施例的用于生成推荐参数配置的方法的流程图;图5示出了根据本专利技术的示例实施例的用于音频信号处理的装置的框图;以及图6示出了适于实现本专利技术的示例实施例的计算机系统的框图。在各个附图中,相同或对应的标号表不相同或对应的部分。【具体实施方式】下面将参考附图中示出的若干示例实施例来描述本专利技术的原理。应当理解,描述这些实施例仅仅是为了使本领域技术人员能够更好地理解进而实现本专利技术,而并非以任何方式限制本专利技术的范围。本专利技术的核心创造性思想在于提出一种用于音频信号处理的配置的混合式推荐。更具体地,根据本专利技术的示例实施例,目标用户的特性可以与一个或多个其他用户的特性自适应地整合。通过将其他用户的信息纳入考虑,配置推荐可以更加有效地收敛到用户的期望。同时,通过使用关于音频内容、设备、环境和/或用户偏好的信息,即使在缺乏用户数据的情况下也能够做出比较准确和可靠的推荐。现在参考图1,其示出了本专利技术的示例实施例可以实现于其中的系统100。如图所示,系统100包括服务器101。根据本专利技术的示例实施例,服务器101可以由任何适当的机器实现,并且可以配备有足够的资源,例如信号处理能力和存储。在系统100基于云架构实现的那些实施例中,服务器101可以是云服务器。系统100还可以包括媒体捕获设备102和媒体使用设备103,二者都连接至服务器101。在某些示例实施例中,媒体捕获设备102和/或媒体使用设备103可以由便携式设备实现,诸如移动电话、个人数字助理(PDA)、膝上型计算机、平板式计算机,等等。备选地,媒体捕获设备102和/或媒体使用设备103可以由固定式机器实现,诸如工作站、个人计算机(PC)或者其他任何适当的计算设备。根据本专利技术的示例实施例,信息在系统100内可以借助于通信网络来传送,例如设备(RF)通信网络,局域网(LAN)、广域网(WAN)或因特网等计算机网络,近场通信网络,或者其组合。而且,服务器101与设备102和103之间的连接可以是有线的,也可以是无线的。本专利技术的范围在此方面不受限制。根据本专利技术的示例实施例,媒体捕获设备102可配置为捕获诸如音频和视频之类的媒体内容。所捕获的媒体内容可以从媒体捕获设备102被上传到服务器101。媒体使用设备103可配置为以本地方式或者通过实时流式播放而使用来自服务器101的媒体内容。在此使用的术语“使用”是指对音频信号的任何使用,诸如回放。根据本专利技术的示例实施例,除了音频信号以及可能的其他媒体内容之外,媒体捕获设备102还可以配置为获取和向服务器101上传与音频信号的捕获相关联的元数据(称为“捕获元数据”)。捕获元数据可以利用各种适当的技术来获取,诸如各种传感器。捕获元数据可以周期性地获取,连续地获取,或者响应于用户命令而被获取。备选地或附加地,某些或者全部元数据可以由媒体捕获设备102的用户输入。用户可以借助于诸如鼠标的指点设备、键盘或者小键盘、轨迹球、触笔、手指、语音、手势或者任何其他交互工具向媒体捕获设备102输入信息。作为示例,在捕获一段音频内容之后,用户可以提供一个或多个标签,指示关于所捕获音频内容的信息。在某些示例实施例中,捕获元数据可以包括内容元数据,其描述所捕获的音频信号的内容。例如,内容元数据可以包括音频信号的长度、类别、声学特征、波形和/或任何其他频域特征或时域特征的有关信息。备选地或附加地,捕获元数据可以包括设备元数据,其描述媒体捕获设备102的一个或多个属性。例如,这种设备元数据可以描述媒体捕获设备102的类型、资源、设置、功能配置和/或可能在媒体捕获过程中影响用户体验的任何其他方面。备选地或附加地,捕获元数据可以包括环境元数据,其描述媒体捕获设备102所在的环境。例如,环境元数据可以包括环境的噪声或者视觉简档,媒体内容被捕获的地理位置,和本文档来自技高网...

【技术保护点】
一种用于音频信号处理的方法,所述方法包括:获取与目标用户对音频信号的使用相关联的第一组元数据;获取与一组参考用户相关联的第二组元数据;以及至少部分地基于所述第一组元数据和所述第二组元数据,针对所述目标用户而生成至少一个参数的推荐配置,所述至少一个参数将被用于所述音频信号的所述使用。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙学京程斌C·鲍尔芦烈马桂林
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1