一种响应者的头部姿态生成方法、装置、设备及存储介质制造方法及图纸

技术编号：38159318 阅读：14 留言：0更新日期：2023-07-13 09:30

本发明专利技术适用于人工智能领域，提供一种响应者头部姿态生成方法、装置、设备及存储介质，该方法通过获取对应响应者的说话者的视频帧序列，以及与视频帧序列对应的音频帧序列，并提取视频帧序列中说话者的头部序列特征以及音频帧序列的音频序列特征，确定响应者在每一帧时刻下对应的初始头部姿态与响应者在每一帧时刻下对应的响应态度信息，得到对应的头部姿态调整系数，根据对应的头部姿态调整系数与对应的初始头部姿态，得到响应者的头部姿态，响应者接收到的音频帧序列作为响应者头部姿态生成的参考特征，使响应者根据音频帧序列的音频序列特征作出相应的反应，提高了响应者头部姿态生成的准确性，从而呈现出响应者对于说话者更真实的反应。者更真实的反应。者更真实的反应。

全部详细技术资料下载

【技术实现步骤摘要】
一种响应者的头部姿态生成方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能领域，尤其涉及一种响应者的头部姿态生成方法、装置、设备及存储介质。

技术介绍

[0002]在虚拟人物合成领域，将说话者与响应者合成虚拟人物进行对话的过程中，一般只对说话者进行驱动，生成对应姿态的动作，响应者实现虚拟角色的动作往往是采用预先录制的视频，使用静态图像、重复帧或预先编写好的动画来合成，重复预先设置的动作，很难有随意的动作变化，这就导致响应者呈现的画面不够真实，无法对说话者做出适当的反应。因此，在对话中针对说话者的表达，如何构建响应者的反馈式反应成为了亟待解决的问题。

技术实现思路

[0003]基于此，有必要针对上述技术问题，提供一种响应者的头部姿态生成方法、装置、设备及存储介质，以解决响应者如何建响应者的反馈式反应的问题。
[0004]第一方面，提供一种响应者的头部姿态生成方法，所述方法包括：
[0005]获取对应所述响应者的说话者的视频帧序列，以及与所述视频帧序列对应的音频帧序列，并提取所述视频帧序列中所述说话者的头部序列特征以及所述音频帧序列的音频序列特征；
[0006]对所述头部序列特征进行解析，确定所述说话者的每一帧时刻对应的对方态度信息，并根据所述对方态度信息，确定所述响应者在每一帧时刻下对应的初始头部姿态；
[0007]对所述音频序列特征进行解析，确定所述响应者在每一帧时刻下对应的响应态度信息，并将所述响应态度信息输入训练好的头部姿态重建模型，输出每一帧时刻对应的...

【技术保护点】

【技术特征摘要】
1.一种响应者头部姿态生成方法，其特征在于，所述头部姿态生成方法包括：获取对应所述响应者的说话者的视频帧序列，以及与所述视频帧序列对应的音频帧序列，并提取所述视频帧序列中所述说话者的头部序列特征以及所述音频帧序列的音频序列特征；对所述头部序列特征进行解析，确定所述说话者的每一帧时刻对应的对方态度信息，并根据所述对方态度信息，确定所述响应者在每一帧时刻下对应的初始头部姿态；对所述音频序列特征进行解析，确定所述响应者在每一帧时刻下对应的响应态度信息，并将所述响应态度信息输入训练好的头部姿态重建模型，输出每一帧时刻对应的头部姿态调整系数；在每一帧时刻下，根据对应的头部姿态调整系数与对应的初始头部姿态，构建得到所述响应者的头部姿态。2.如权利要求1所述的响应者的头部姿态生成方法，其特征在于，所述提取所述视频帧序列中所述说话者的头部序列特征，包括：将所述视频帧序列输入至预设的头部检测神经网络模型，输出所述视频帧序列中所述说话者的头部区域；对每一帧中的所述头部区域进行特征点检测，得到对应的所述说话者的头部序列特征。3.如权利要求1所述的响应者的头部姿态生成方法，其特征在于，所述提取所述音频帧序列的音频序列特征，包括：利用预设计算公式，计算所述音频帧序列中每一帧中信号的能量值，得到每一音频帧的能量特征；提取所述音频帧序列中的时域信号与音频信号，根据所述时域信号与音频信号，得到频域特征与时域特征；根据所述音频帧序列，结合所述能量特征、所述频域特征和所述时域特征，得到音频序列特征。4.如权利要求1所述的响应者的头部姿态生成方法，其特征在于，所述对所述头部序列特征进行解析，确定所述说话者的每一帧时刻对应的对方态度信息，并根据所述对方态度信息，确定所述响应者在每一帧时刻下对应的初始头部姿态，包括：根据所述头部序列特征中的相邻帧的头部特征，通过预设算法，得到所述相邻帧的头部特征差异值；根据所述头部特征差异值确定所述说话者的每一帧时刻对应的对方态度信息；根据所述对方态度信息与预设的初始头部姿态模型，得到所述响应者在每一帧时刻下对应的初始头部姿态。5.如权利要求1所述的响应者的头部姿态生成方法，其特征在于，所述对所述音频序列特征进行解析，确定所述响应者在每一帧时刻下对应的响应态度信息，包括：根据所述音频序列特征与预设的态度识别规则，得到所述音频...

【专利技术属性】
技术研发人员：凌天东，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人