用于生成视频的方法、装置、设备和介质制造方法及图纸

技术编号：24891316 阅读：37 留言：0更新日期：2020-07-14 18:17

本公开的实施例公开了用于生成视频的方法、装置、设备和介质。该用于生成视频的方法的一具体实施方式包括：获取目标用户的用户交互信息；基于用户交互信息，生成针对用户交互信息的反馈信息；基于反馈信息，生成用于指示预设人员执行与反馈信息相对应的动作的视频。该实施方式可以通过生成视频的方式与用户进行信息交互，由此提高了交互方式的多样性，有助于避免用户与真人进行交互过程中产生的羞涩感。

全部详细技术资料下载

【技术实现步骤摘要】
用于生成视频的方法、装置、设备和介质
本公开的实施例涉及计算机
，具体涉及用于生成视频的方法、装置、设备和介质。
技术介绍
人机交互技术(Human-ComputerInteracTIonTechniques)是信息化技术发展的产物，是一种通过计算机输入、输出设备，以有效的方式实现人与计算机对话的技术。其实现了从人适应计算机到计算机适应人的转化。目前，人机交互方式不仅包括键盘输入、手柄操作，还包括更加新奇的方式，例如，手指的微小动作、声波在空气中的振动、眼珠和舌头的转动等等，都可以实现信息传递，完成人与机器之间的“对话”。
技术实现思路
本公开提出了用于生成视频的方法、装置、设备和介质。第一方面，本公开的实施例提供了一种用于生成视频的方法，该方法包括：获取目标用户的用户交互信息；基于用户交互信息，生成针对用户交互信息的反馈信息；基于反馈信息，生成用于指示预设人员执行与反馈信息相对应的动作的视频。在一些实施例中，反馈信息为文本信息；以及，基于反馈信息，生成用于指示预设人员执行与...

【技术保护点】
1.一种用于生成视频的方法，包括：/n获取目标用户的用户交互信息；/n基于所述用户交互信息，生成针对所述用户交互信息的反馈信息；/n基于所述反馈信息，生成用于指示预设人员执行与所述反馈信息相对应的动作的视频。/n

【技术特征摘要】
1.一种用于生成视频的方法，包括：
获取目标用户的用户交互信息；
基于所述用户交互信息，生成针对所述用户交互信息的反馈信息；
基于所述反馈信息，生成用于指示预设人员执行与所述反馈信息相对应的动作的视频。

2.根据权利要求1所述的方法，其中，所述反馈信息为文本信息；以及
所述基于所述反馈信息，生成用于指示预设人员执行与所述反馈信息相对应的动作的视频，包括：
确定与所述文本信息相对应的音素信息和语调信息；
基于所述音素信息和所述语调信息，生成用于指示预设人员执行与所述反馈信息相对应的动作的视频。

3.根据权利要求2所述的方法，其中，所述基于所述音素信息和所述语调信息，生成用于指示预设人员执行与所述反馈信息相对应的动作的视频，包括：
基于所述音素信息，确定待生成的语音音频的音频帧数量，以及待生成的图像序列的图像数量，其中，所述音频帧数量与所述图像数量相等；
基于所述音素信息和所述语调信息，生成语音音频和图像序列，其中，所述语音音频包括的音频帧的数量为所述音频帧数量，所述图像序列中的图像的数量为所述图像数量，所述图像序列指示预设人员执行与所述语音音频相对应的动作；
将所述语音音频和所述图像序列进行合成，得到用于指示所述预设人员执行与所述语音音频相对应的动作的视频。

4.根据权利要求3所述的方法，其中，所述语音音频中的音频帧与所述图像序列中的图像一一对应，所述图像序列中的图像的口型表征：所述预设人员发出与该图像相对应的音频帧指示的语音。

5.根据权利要求1-4之一所述的方法，其中，所述用户交互信息包括用户视频；以及
所述基于所述用户交互信息，生成针对所述用户交互信息的反馈信息，包括：
响应于所述用户视频中的语音音频满足预设语调调整条件，生成用于指示用户调整音频的语调的反馈信息；
响应于所述用户视频中的图像中的口型符合预设口型调整条件，生成用于指示用户调整口型的反馈信息。

6.根据权利要求1-4之一所述的方法，其中，所述基于所述反馈信息，生成用于指示预设人员执行与所述反馈信息相对应的动作的视频，包括：
响应于所述用户交互信息包括语音音频，从预先确定的情感类别集合中，确定所述语音音频所属的情感类别；
基...

【专利技术属性】
技术研发人员：殷翔，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人