一种面部驱动方法、系统、电子设备和可读存储介质技术方案

技术编号：39423526 阅读：9 留言：0更新日期：2023-11-19 16:11

本申请提供一种面部驱动方法、系统、电子设备和可读存储介质，该面部驱动方法包括：根据输入的语音，确定所述语音中各时刻音素对应的第一混合形变变形器BS系数，其中，所述BS系数用于表示所述语音对应的面部状态；确定所述语音中的各时刻音素对应的面下系数，其中，所述面下系数用于调整嘴部开合程度；根据所述各时刻音素对应的面下系数，动态调整各时刻音素对应的第一BS系数，获得各时刻音素对应的第二BS系数；采用所述第二BS系数驱动面部动作。本申请通过对各个时刻的面下系数进行调整，来实现根据音频属性自动控制口型幅度来驱动面部，能够增强面部驱动效果。能够增强面部驱动效果。能够增强面部驱动效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种面部驱动方法、系统、电子设备和可读存储介质

[0001]本申请实施例涉及面部驱动
，尤其涉及一种面部驱动方法、系统、电子设备和可读存储介质。

技术介绍

[0002]通过输入一段语音，模型自动生成匹配该语音的口型、表情等面部动作的面部驱动技术，可应用于虚拟人、数字孪生、动画等领域。
[0003]在驱动的过程中，不同的语音状态会对应不同的口型幅度，比如用压抑低沉状态下的语音驱动面部时，虚拟人的口型幅度要相对较小；明快激昂的语音驱动面部时，口型幅度要相对较大。目前面部驱动中体现这种带有情绪差异的方案，一般是通过采集不同状态下的数据如：低沉、平静、激扬等，然后用带状态标签的数据进行训练，得到可选状态的表情驱动模型。
[0004]但是，这样通过设定指定状态的表情驱动模型通常是在语音前设定，即整段语音通用一种状态的表情驱动规则，不能根据音频属性自动控制口型幅度来驱动面部；并且这样通过采集不同状态下的数据进行训练的方案，可能会出现采集的数据不理想的问题，很难录制到指定状态下的自然表情数据，表情会显得刻意，导致训练的模型效果不佳。

技术实现思路

[0005]本申请实施例提供一种面部驱动方法、系统、电子设备和可读存储介质，以解决现有的根据音频属性自动控制口型幅度来驱动面部的问题。
[0006]为了解决上述技术问题，本申请是这样实现的：
[0007]第一方面，本申请实施例提供了一种面部驱动方法，包括：
[0008]根据输入的语音，确定所述语音中各时刻音素对应的第一混合形变...

【技术保护点】

【技术特征摘要】
1.一种面部驱动方法，其特征在于，包括：根据输入的语音，确定所述语音中各时刻音素对应的第一混合形变变形器BS系数，其中，所述BS系数用于表示所述语音对应的面部状态；确定所述语音中的各时刻音素对应的面下系数，其中，所述面下系数用于调整嘴部开合程度；根据所述各时刻音素对应的面下系数，动态调整各时刻音素对应的第一BS系数，获得各时刻音素对应的第二BS系数；采用所述第二BS系数驱动面部动作。2.根据权利要求1所述的方法，其特征在于，所述面下系数包括嘴唇系数和下巴系数，所述嘴唇系数用于调整嘴唇开合程度，所述下巴系数用于调整下巴开合程度。3.根据权利要求1所述的方法，其特征在于，所述确定所述语音中的各时刻音素对应的面下系数包括：根据输入的语音，确定当前音素的音高和响度；根据所述当前音素的音高和响度，确定当前音素的面下系数。4.根据权利要求3所述的方法，其特征在于，所述根据输入的语音，确定当前音素的音高和响度包括：根据输入的语音，确定该语音对应的音素序列和每个音素的发音时长组成的时长序列；根据当前音素在所述音素序列和所述时长序列中对应的项，确定当前音素的音高和响度。5.根据权利要求1
‑
4任意一项所述的方法，其特征在于，还包括：确定情绪系数，所述情绪系数用于表示情绪基调；其中，根据所述各时刻音素对应的面下系数，动态调整各时刻音素对应的第一BS系数，获得各时刻音素对应的第二BS系数，包括：根据所述情绪系数和所述各时刻音素对...

【专利技术属性】
技术研发人员：李宏龙，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人