用于创建基于对象的音频内容的方法和系统技术方案

技术编号：27262069 阅读：29 留言：0更新日期：2021-02-06 11:22

本文描述了一种用于根据文本输入创建在有声读物和/或音频播放中使用的基于对象的音频内容的方法，该方法包括以下步骤：a)接收文本输入；b)对接收到的文本输入执行语义分析；c)基于语义分析的一个或多个结果合成语音和效果以生成一个或多个音频对象；d)生成针对一个或多个音频对象的元数据；以及e)创建包括一个或多个音频对象和元数据的基于对象的音频内容。本文进一步描述了：一种基于计算机的系统，该基于计算机的系统包括一个或多个处理器，该一个或多个处理器被配置为执行所述方法；以及一种计算机程序产品，该计算机程序产品包括具有指令的计算机可读存储介质，该指令被适配成当由具有处理能力的设备执行时执行所述方法。所述方法。所述方法。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于创建基于对象的音频内容的方法和系统
[0001]相关申请的交叉引用
[0002]本申请要求于2018年7月19日提交的西班牙专利申请号P201830728、于2018年9月27日提交的美国临时专利申请号62/737,330以及于2018年10月19日提交的欧洲专利申请号18201444.9的优先权的权益，所述专利申请通过引用以其全文并入本文。

[0003]本公开总体涉及一种基于文本输入创建在有声读物和/或音频播放中使用的基于对象的音频内容的方法，并且更具体地涉及基于对文本输入的更深入的语义分析来创建基于对象的音频内容。
[0004]尽管本文将特别参考该公开内容来描述一些实施例，但是应当理解，本公开不限于这种使用领域，并且可应用于更广泛的背景下。

技术介绍

[0005]在整个公开内容中对
技术介绍
的任何讨论绝不应视为承认这种技术是本领域众所周知的或形成本领域公知常识的一部分。
[0006]如今，有声读物和音频播放提供超越仅书面单词的文学体验。进行文本到语音的转换以在有声读物和音频播放中回放是公认的，并且经历持续发展。使合成的语音听起来更自然并且更具情感仅是要实现的一个目标。
[0007]US 2017/0169811 A1公开了例如一种用于对诸如文学作品的文本作品执行文本到语音(TTS)处理的系统和方法。这些作品的文本被处理，并且确定与章节、段落、句子、单词、对话部分以及其他上下文的部分中的一个或多个相对应的偏移。使用这些偏移进一步确定一次使用TTS处理要处理作品的哪个部分以及...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于根据文本输入创建在有声读物和/或音频播放中使用的基于对象的音频内容的方法，所述方法包括以下步骤：a)接收所述文本输入；b)对接收到的文本输入执行语义分析；bi)确定空间信息，作为所述语义分析的一个或多个结果；c)基于所述语义分析的所述一个或多个结果合成语音和效果以生成一个或多个音频对象；d)生成针对所述一个或多个音频对象的元数据；以及e)创建包括所述一个或多个音频对象和所述元数据的所述基于对象的音频内容。2.根据权利要求1所述的方法，其中，所述方法进一步包括以下步骤：bii)识别语音和效果的一个或多个起源，作为所述语义分析的所述一个或多个结果。3.根据权利要求2所述的方法，其中，所述语音和效果的起源包括演员、旁白员、物品和环境中的一个或多个。4.根据权利要求2至3中任一项所述的方法，其中，针对所述语音和效果的一个或多个起源确定所述空间信息。5.根据权利要求1至4中任一项所述的方法，其中，所述空间信息包括关于行进的方向、速度、大小、形状、位置、连贯性或加速度中的一个或多个的信息。6.根据权利要求1至5中任一项所述的方法，其中，所述方法进一步包括以下步骤：aii)对接收到的文本...

【专利技术属性】
技术研发人员：T，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人