虚拟主播合成方法、装置、计算机设备、可读存储介质制造方法及图纸

技术编号：37331950 阅读：43 留言：0更新日期：2023-04-21 23:09

本申请实施例提供一种虚拟主播合成方法、装置、计算机设备、可读存储介质。虚拟主播合成方法包括：预先建立人偶动作库，人偶动作库中存储与多组人偶动作形态一一对应的多个三维动作数据包，将整篇新闻文稿自动生成语音包，在整篇新闻文稿中的每句需要插入人偶动作形态的新闻文稿中均插入人偶动作库中多个三维动作数据包中的一个三维动作数据包，使得根据语音包和插入至整篇新闻文稿中的所有人偶动作形态对应的三维动作数据包按照第一时间戳与第三时间戳的对应关系进行动画合成，生成虚拟主播。本申请的技术方案中，可以达到自动化生产虚拟主播的效果，生成周期较短，能够满足日常化、大批量、长时段的新闻播报要求，大幅减少生产成本。少生产成本。少生产成本。

全部详细技术资料下载

【技术实现步骤摘要】
虚拟主播合成方法、装置、计算机设备、可读存储介质

[0001]本申请实施例涉及通信领域，尤其涉及一种虚拟主播合成方法、装置、计算机设备、可读存储介质。

技术介绍

[0002]虚拟主播是使用虚拟形象在视频节目中出场的虚拟人物。虚拟主播用于视频节目，可以替代人工主持人播报新闻、播报天气预报、完成串场解说或主持等。虚拟主播还可应用于视频直播或客户服务，以替代人工与观众或客户进行视频交互。虚拟主播替代人工，可以解决人工成本高、工作质量不稳定等问题。
[0003]现有技术中，虚拟人物的造型大多通过真人驱动的方式来实现，例如目前国内推出的一些唱跳类虚拟人物，较为知名的包括湖南卫视虚拟主持人“小漾”，以及“洛天依”、“柳夜熙”、“AYAYI”，等。这一类虚拟人物主要向观众展示舞蹈动作，说唱时的面部表情和唇音同步还不够逼真。
[0004]现有技术中，虚拟主播(或虚拟主持人)通常没有肢体动作配合，而是仅有头部动作以及配合语音播报时的口型变化，如央视的“康晓辉”、人民日报的“果果”，等。
[0005]通常，每次生成动态播...

【技术保护点】

【技术特征摘要】
1.一种虚拟主播合成方法，其特征在于，所述虚拟主播合成方法包括：预先建立人偶动作库，所述人偶动作库中存储与多组人偶动作形态一一对应的多个三维动作数据包以及与所述多组人偶动作形态一一对应的多个命名，每个所述三维动作数据包用于合成一组对应的所述人偶动作形态；将整篇新闻文稿自动生成语音包，所述语音包用于合成播报的语音，所述语音包带有多个第一时间戳，所述多个第一时间戳与所述整篇新闻文稿中每句新闻文稿的多个第二时间戳一一对应；搭建用于在所述整篇新闻文稿中插入动作脚本的编辑界面，并且所述编辑界面所在窗口带有用于插入所述动作脚本的选择器；在所述编辑界面接收到所述选择器被选中的第一指令时，调用并显示根据所述人偶动作库中所有三维动作数据包生成的多组人偶动作形态的选择界面，在所述选择界面接收到所述多组人偶动作形态中的任一组人偶动作形态被选中的第二指令时，根据所述第一指令的指示将被选中的一组所述人偶动作形态插入至所述整篇新闻文稿中的指定位置，并且在所述指定位置生成脚本，所述脚本用于指示被选中的一组所述人偶动作形态的命名和与所述指定位置对应的一句新闻文稿相匹配的第三时间戳，直到所述整篇新闻文稿中需要插入所述多组人偶动作形态中的一组人偶动作形态的每句新闻文稿均插入一组人偶动作形态；根据所述语音包和插入至所述整篇新闻文稿中的所有人偶动作形态对应的三维动作数据包按照所述第一时间戳与所述第三时间戳的对应关系进行动画合成，生成虚拟主播。2.根据权利要求1所述的虚拟主播合成方法，其特征在于，所述预先建立人偶动作库的步骤具体包括：建立具有基本骨架的虚拟人偶模型；基于所述虚拟人偶模型的基本骨架设定多组不同的人偶动作形态；分别建立多组人偶动作形态和多个预设时间段的一一对应关系，将所述一一对应关系进行存储形成人偶动作库；根据所述一一对应关系分别采集与多组人偶动作形态一一对应的三维动作数据包，并且每组所述人偶动作形态均对应一个命名；将所有的所述人偶动作形态、所述三维动作数据包以及所述命名按照一一对应的方式存储至所述人偶动作库。3.根据权利要求2所述的虚拟主播合成方法，其特征在于，根据所述一一对应关系分别采集与多组人偶动作形态一一对应的三维动作数据包的步骤，具体包括：根据所述一一对应关系，按照中之人动作捕捉的方式分别采集所述多个预设时间段内的多组三维动作数据包，每组所述三维动作数据包均包括头部、双手、双脚以及躯干的主要关节点运动变化的数据。4.根据权利要求1所述的虚拟主播合成方法，其特征在于，所述将整篇新闻文稿自动生成用于播报的语音包的步骤，具体包括：建立虚拟主播人工智能AI语音合成音色，根据建立的所述AI语音合成音色通过AI语音合成能力将整篇新闻文稿自动生成用于播报的语音包。5.根据权利要求1所述的虚拟主播合成方法，其特征在于，在所述整篇新闻文稿中如果有未插入所述多组人偶动作形态中的一组人偶动作形态的一句或多句新闻文稿，则在所述
进行动画合成时，还根据默认三维动作数...

【专利技术属性】
技术研发人员：吴佳俊，
申请(专利权)人：上海东方传媒技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人