用于用户生成内容捕获和自适应渲染的方法、装置和系统制造方法及图纸

技术编号：43948838 阅读：27 留言：0更新日期：2025-01-07 21:37

描述了处理与用户生成内容相关的音频数据的方法。一种方法包括：获得所述音频数据；对所述音频数据应用逐帧音频增强；基于所述逐帧音频增强的一个或多个处理参数来生成所述增强的音频数据的元数据；以及将所述增强的音频数据与所述元数据一起输出。另一种方法包括：获得所述音频数据以及所述音频数据的元数据，其中，所述元数据包括第一元数据，所述第一元数据指示所述音频数据的先前的逐帧音频增强的一个或多个处理参数；使用所述一个或多个处理参数对所述音频数据应用恢复处理，以至少部分地逆转先前的逐帧音频增强；以及对所恢复的原始音频数据应用逐帧音频增强或编辑处理。进一步描述了对应的装置、程序和计算机可读存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本文件涉及用于用户生成内容(ugc)的捕获和自适应渲染的方法、装置和系统。本文件特别涉及移动设备上的ugc内容创建，该ugc内容创建使得在回放期间能够进行自适应渲染，并且涉及回放期间的自适应渲染。

技术介绍

1、最近，ugc已成为在可变环境中分享个人时刻的趋势。ugc多由移动设备记录。由于消费者硬件限制、系统性能要求、捕获方式的多样性以及回放环境，大多数此类内容都会有声音伪影。

2、为了克服硬件限制和记录环境带来的音质问题，可以增强ugc音频以获得更好的收听体验。利用当时可用的信息，可以在捕获期间或捕获之后立即以实时方式来应用某些音频增强。这种增强可以直接应用于音频流并且以实时方式来生成增强的音频流。然后，可以在无需回放设备上特定软件支持的情况下渲染增强的音频。由此，ugc内容创建者可以在不付出额外努力的情况下提高其内容的音频质量，并确保这种增强能在最大程度上对其内容消费者可得。

3、然而，对于进一步增强的音频质量，还有一些依赖实时可用信息之外的额外信息的音频增强。此外，捕获之后的实时增强可能无法与端到端的内容处...

【技术保护点】

1.一种处理与用户生成内容相关的音频数据的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，对所述音频数据应用所述逐帧音频增强包括应用以下各项中的至少一项：

3.根据权利要求1或2所述的方法，其中，所述一个或多个处理参数包括在所述逐帧音频增强期间应用的频带增益和/或全频带增益。

4.根据权利要求1或2所述的方法，其中，所述一个或多个处理参数包括以下各项中的至少一项：

5.根据前述权利要求中任一项所述的方法，其中，所述逐帧音频增强是以实时方式来应用的。

6.根据前述权利要求中任一项所述的方法，其中，所述元数据是进一步基于对...

【技术特征摘要】
【国外来华专利技术】

1.一种处理与用户生成内容相关的音频数据的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，对所述音频数据应用所述逐帧音频增强包括应用以下各项中的至少一项：

3.根据权利要求1或2所述的方法，其中，所述一个或多个处理参数包括在所述逐帧音频增强期间应用的频带增益和/或全频带增益。

4.根据权利要求1或2所述的方法，其中，所述一个或多个处理参数包括以下各项中的至少一项：

5.根据前述权利要求中任一项所述的方法，其中，所述逐帧音频增强是以实时方式来应用的。

6.根据前述权利要求中任一项所述的方法，其中，所述元数据是进一步基于对所述音频数据的多个帧的分析的结果来生成的。

7.根据权利要求6所述的方法，其中，所述对所述音频数据的多个帧的分析产生所述音频数据的长期统计数据。

8.根据权利要求6或7所述的方法，其中，所述对所述音频数据的多个帧的分析产生所述音频数据的一个或多个音频特征。

9.根据权利要求8所述的方法，其中，所述音频数据的所述音频特征涉及以下各项中的至少一项：

10.根据权利要求6至9中任一项所述的方法，其中，所述元数据包括第一元数据和第二元数据，所述第一元数据是基于所述逐帧音频增强的所述一个或多个处理参数生成的，并且所述第二元数据是基于分析所述音频数据的多个帧的结果生成的；以及

11.一种处理与用户生成内容相关的音频数据的方法，所述方法包括：

12.根据权利要求11所述的方法，其中，对所述音频数据应用所述恢复处理包括应用以下各项中的至少一项：

13.根据权利要求11或12所述的方法，其中，所述一个或多个处理参数包括在所述先前的逐帧音频增强期间应用的频带增益和/或全频带增益。

14.根据权利要求11或12所述的方法，其中，所述一个或多个处理参数包括以下各项中的至少一项：

15.根据权利要求11至14中任一项所述的方法，其中，所述元数据进一步包括第二元数据，所述第二元数据指示所述音频数据的长期统计数据和/或指示所述音频数据的一个或多个音频特征。

16.根据权利要求15所述的方法，其中，所述音频数据的所述音频特征涉及以下各项中的至少一项：

17.根据权利要求15或16所述的方法，其中，对所述原始音频数据应用所述逐帧音频增强是基于所述第二元数据的。

18.根据权利要求11至17中任一项所述的方法，其中，对所述原始音频数据应用所述逐帧音频增强包括应用以下各项中的至少一项：

19.一种用于处理与用户生成内容相关的音频数据的装置，所述装置包括：

20.根据权利要求19所述的装置，其中，所述处理模块被配置为对所述音频数据应用以下各项中的至少一项：

21.根据权利要求19或20所述的装置，其中，所述一个或...

【专利技术属性】
技术研发人员：马远星，双志伟，刘阳，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人