生成虚拟人物播报视频的方法、系统及可读存储介质技术方案

技术编号：34844896 阅读：17 留言：0更新日期：2022-09-08 07:43

本申请提供一种生成虚拟人物播报视频的方法、系统及可读存储介质。本申请的方法中，服务器提供视频创作页面，用户通过视频创作页面可以在线设置视频中的虚拟人物形象、视频播报的内容数据、视频播报相关的设置参数，进行视频的创作，并将创作完成的视频创作数据提交至服务器。服务器接收视频生成服务请求，获取通过视频创作页面编辑好的视频创作数据，根据编辑好的视频创作数据在线生成虚拟人物播报视频，并输出虚拟人物播报视频，实现虚拟人物视频的在线编辑、在线生成和输出的一站式的视频创作，大大缩短生成虚拟人物视频所需的时间周期，提高了生成虚拟人物视频的效率。提高了生成虚拟人物视频的效率。提高了生成虚拟人物视频的效率。

全部详细技术资料下载

【技术实现步骤摘要】
生成虚拟人物播报视频的方法、系统及可读存储介质

[0001]本申请涉及计算机技术中的人工智能、虚拟现实等领域，尤其涉及一种生成虚拟人物播报视频的方法、系统及可读存储介质。

技术介绍

[0002]随着互联网技术的发展，在教育、传媒、金融等各类行业中，存在大量向用户提供知识播报类服务的场景，大多通过播放预先制作好的人物播报视频的方式实现。例如，教育行业中预先制作培训课程视频，传媒行业中预先制作人物播报类的节目视频等，金融行业中预先制作金融类知识讲解视频、服务流程讲解视频等。
[0003]传统的人物播报类视频的制作大多是通过真人拍摄完成，需要请专业的视频拍摄团队，包括播报人、摄像、导演、剪辑等，视频制作的工作量大、时间周期长、制作成本高。
[0004]目前，各个行业中出现了基于虚拟人物制作播报类视频的方案，但这些方案均是针对用户提供一对一的线下视频制作服务，针对用户需求定制虚拟人物形象、视频素材、视频内容等等，但是视频制作的周期仍然需要若干天甚至几个月，视频制作的时间周期仍然较长。

技术实现思路

[0005]本申请提供一种生成虚拟人物播报视频的方法、系统及可读存储介质，用以解决人物播报类视频制作的周期较长的问题。
[0006]一方面，本申请提供一种生成虚拟人物播报视频的方法，包括：
[0007]提供视频创作页面；
[0008]接收视频生成服务请求，获取通过所述视频创作页面编辑好的视频创作数据，所述视频创作数据包括：虚拟人物设置数据、播报内容数据和视频设置参数；
>[0009]根据所述播报内容数据，确定待播报的文本内容和所述文本内容对应的播报语音；
[0010]根据所述文本内容、所述播报语音和所述虚拟人物设置数据，驱动虚拟人物执行播报所述播报语音的行为，并根据所述视频设置参数渲染生成虚拟人物播报视频；
[0011]输出所述虚拟人物播报视频。
[0012]另一方面，本申请提供一种虚拟人物播报视频生成系统，包括：
[0013]交互界面模块，用于提供视频创作页面；
[0014]视频创作模块，用于接收视频生成服务请求，获取通过所述视频创作页面编辑好的视频创作数据，所述视频创作数据包括：虚拟人物设置数据、播报内容数据和视频设置参数；
[0015]播报内容处理模块，用于根据所述播报内容数据，确定待播报的文本内容和所述文本内容对应的播报语音；
[0016]驱动渲染模块，用于根据所述文本内容、所述播报语音和所述虚拟人物设置数据，
驱动虚拟人物执行播报所述播报语音的行为，并根据所述视频设置参数渲染生成虚拟人物播报视频；
[0017]视频输出模块，用于输出所述虚拟人物播报视频。
[0018]另一方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如上述所述的方法。
[0019]本申请提供的生成虚拟人物播报视频的方法、系统及可读存储介质，服务器提供视频创作页面，用户通过视频创作页面可以在线设置视频中的虚拟人物形象、视频播报的内容数据、视频播报相关的设置参数，进行视频的创作，并将创作完成的视频创作数据提交至服务器。服务器接收视频生成服务请求，获取通过视频创作页面编辑好的视频创作数据，根据编辑好的视频创作数据在线生成虚拟人物播报视频，并输出虚拟人物播报视频，实现虚拟人物视频的在线编辑、在线生成和输出的一站式的视频创作，大大缩短生成虚拟人物视频所需的时间周期，提高了生成虚拟人物视频的效率。
附图说明
[0020]此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。
[0021]图1为本申请提供的生成虚拟人物播报视频的方法的系统架构的示例图；
[0022]图2为本申请一示例性实施例提供的生成虚拟人物播报视频的方法流程图；
[0023]图3为本申请一示例性实施例提供的图文输入方式的视频内容编辑页面的示例图；
[0024]图4为本申请一示例性实施例提供的图文数据编辑页面的示例图；
[0025]图5为本申请一示例性实施例提供的文本输入方式的视频内容编辑页面的示例图；
[0026]图6为本申请一示例性实施例提供的语音输入方式的视频内容编辑页面的示例图；
[0027]图7为本申请一示例性实施例提供的视频管理页面的示例图；
[0028]图8为本申请一示例性实施例提供的虚拟人物播报视频生成系统的架构图。
[0029]通过上述附图，已示出本申请明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围，而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0030]这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0031]针对人物播报类视频制作的周期较长的问题，本申请提供一种生成虚拟人物播报视频的方法，该方法基于服务器向广大用户提供虚拟人物播报视频的制作服务，实现虚拟人物播报视频的在线制作，用户提交视频生成服务请求后，等待若干分钟甚至更短，即可在
线获取生成的虚拟人物播报视频，大大缩短了虚拟人物播报视频制作的时间周期。
[0032]示例性地，本申请提供的生成虚拟人物播报视频的方法，可以适用于图1所示的系统架构。如图1所示，该系统架构包括：终端和服务器。
[0033]其中，该服务器可以是部署在云端的服务器集群。该服务器上存储有系统内置的虚拟人物形象、视频中的画面素材，并能够存储用户的视频生成任务和视频创作数据，通过服务器中预设运算逻辑，服务器可以实现基于用户编辑好的视频创作数据，在线生成虚拟人物播报视频，并将生成的虚拟人物播报视频在线提供给用户的功能。
[0034]终端具体可为具有网络通信功能、运算功能以及信息显示功能的硬件设备，其包括但不限于智能手机、平板电脑、台式电脑、物联网设备等。
[0035]通过服务器的通信交互，终端可以显示服务器提供的视频创作页面，以使用户进行虚拟人物设置、播报内容和视频设置参数等视频创作数据的编辑，并向服务器提交编辑好的视频创作数据和视频生成服务请求，服务器接收视频生成服务请求，获取编辑好的视频创作数据之后，根据视频创作数据进行虚拟人物的驱动和渲染，生成虚拟人物播报视频，并在线地向终端提供虚拟人物播报视频。
[0036]示例性地，生成的虚拟人物播报视频可以由服务器直接或间接地提供给终端。例如，服务器可以提供虚拟人物播报视频的下载功能，终端可以从服务器下载虚拟人物播报视频；或者，服务器提供虚拟人物播报视频的预览功能，服务器可以接收终端对已生本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种生成虚拟人物播报视频的方法，其特征在于，包括：提供视频创作页面；接收视频生成服务请求，获取通过所述视频创作页面编辑好的视频创作数据，所述视频创作数据包括：虚拟人物设置数据、播报内容数据和视频设置参数；根据所述播报内容数据，确定待播报的文本内容和所述文本内容对应的播报语音；根据所述文本内容、所述播报语音和所述虚拟人物设置数据，驱动虚拟人物执行播报所述播报语音的行为，并根据所述视频设置参数渲染生成虚拟人物播报视频；输出所述虚拟人物播报视频。2.根据权利要求1所述的方法，其特征在于，所述播报内容数据包括由至少一个图文数据组成的图文序列，所述图文数据包括文本信息，或者，所述图文数据包括文本信息和所述文本信息对应的图像，所述视频设置参数包括图文数据中的图像在播报画面中的位置和大小；所述根据所述播报内容数据，确定待播报的文本内容和所述文本内容对应的播报语音，包括：将所述图文数据中的文本信息作为待播报的文本内容片段；将所述文本内容片段转换为对应的音频数据；根据所述文本内容片段对应的音频数据和所述视频设置参数中的播报声音设置信息，生成所述文本信息对应的语音片段。3.根据权利要求2所述的方法，其特征在于，所述根据所述文本内容、所述播报语音和所述虚拟人物设置数据，驱动虚拟人物执行播报所述播报语音的行为，并根据所述视频设置参数渲染生成虚拟人物播报视频，包括：对所述图文序列中的每一所述图文数据，根据所述图文数据中的文本信息和所述文本信息对应的语音片段，确定虚拟人物的驱动数据；根据所述驱动数据，进行虚拟人物的驱动和渲染，生成播报所述语音片段过程中的虚拟人物图像数据；根据所述视频设置参数中播报界面的画面设置信息，获取播报所需的画面素材；根据所述语音片段、播报所述语音片段过程中的虚拟人物图像数据、播报所需的画面素材、所述图文数据中的图像和图像在播报画面中的位置信息，合成所述图文数据对应的虚拟人物播报视频片段；将所述图文序列中所述图文数据对应的虚拟人物播报视频片段按顺序拼接，得到虚拟人物播报视频。4.根据权利要求1所述的方法，其特征在于，所述播报内容数据为文本数据，所述根据所述播报内容数据，确定待播报的文本内容和所述文本内容对应的播报语音，包括：将所述文本数据作为待播报的文本内容；将所述文本数据转换为对应的音频数据；根据所述音频数据和所述视频设置参数中的播报声音设置信息，生成所述文本内容对应的播报语音。5.根据权利要求1所述的方法，其特征在于，所述播报内容数据为语音数据，所述根据所述播报内容数据，确定待播报的文本内容和所述文本内容对应的播报语音，包括：
将所述播报内容数据作为待播报的文本内容对应的播报语音；将所述播报内容数据转换为文本数据，得到待播报的文本内容。6.根据权利要求4或5所述的方法，其特征在于，所述根据所述文本内容、所述播报语音和所述虚拟人物设置数据，驱动虚拟人物执行播报所述播报语音的行为，并根据所述视频设置参数渲染生成虚拟人物播报视频，包括：根据所述文本内容和所述播报语音，确定虚拟人物的驱动数据；根据所述驱动数据...

【专利技术属性】
技术研发人员：张雨欣，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人