一种播报数字人形态生成与控制方法技术

技术编号：38002217 阅读：9 留言：0更新日期：2023-06-30 10:16

本发明专利技术公开了一种播报数字人形态生成与控制方法，涉及AI领域。本发明专利技术包括以下步骤：S1：采集人像素材，所述人像素材包括音频和面部表情；S2：将音频与面部表情中的唇部动作相匹配；S3：通过设置不同的控制参量，协同驱动面部表情动画的生成；S4：基于面部表情动画根据播报内容匹配合适的手势，生成手势模型。本发明专利技术从表情生成和动作驱动两个方面入手，实现数字人形态的自动生成和控制。字人形态的自动生成和控制。字人形态的自动生成和控制。

全部详细技术资料下载

【技术实现步骤摘要】
一种播报数字人形态生成与控制方法

[0001]本专利技术涉及AI领域，更具体的说是涉及一种播报数字人形态生成与控制方法。

技术介绍

[0002]随着元宇宙概念的火爆，元宇宙的“原住民”——数字人得到了快速发展。虚拟偶像、虚拟代言人、数字人客服、数字人记者、数字人主播
……
数字人产品和服务被应用到各行各业。
[0003]不同于其他行业数字人，新闻播报数字人在媒体行业的应用主要有以下特点：
[0004](1)主播形象相对严肃；
[0005](2)播报时身体姿态相对固定，大多数时间为站姿或坐姿，主要依靠面部表情和手势动作提高人物的动态感；
[0006](3)新闻要求时效性，播报数字人需要在短时间内快速生成出播报视频。
[0007]目前，大部分数字人主要通过动作捕捉的方法控制形态，但是需要花费较多的人力、物力和时间，综合来看不适用于新闻播报数字人的形态驱动。因此，我们需要构建一套低成本、高效率
[0008]、自然协调、高仿真的播报数字人形态生成和控制模型，进一步推广播报数字人在媒体行业的生产和应用。

技术实现思路

[0009]有鉴于此，本专利技术提供了一种播报数字人形态生成与控制方法，从表情生成和动作驱动两个方面入手，实现数字人形态的自动生成和控制，涉及人脸建模和分析、语音合成、语音识别、机器学习、自然语言处理等多种技术。
[0010]为了实现上述目的，本专利技术采用如下技术方案：
[0011]一种播报数字人形态生成与控制方法，...

【技术保护点】

【技术特征摘要】
1.一种播报数字人形态生成与控制方法，其特征在于，包括以下步骤：S1：采集人像素材，所述人像素材包括音频和面部表情；S2：将音频与面部表情中的唇部动作相匹配；S3：通过设置不同的控制参量，协同驱动面部表情动画的生成；S4：基于面部表情动画根据播报内容匹配合适的手势，生成手势模型。2.根据权利要求1所述的一种播报数字人形态生成与控制方法，其特征在于，在S2中具体包括以下步骤：对输入音频进行处理，具体包括语音识别和对声韵母拆分，并获取每个字的起始终止时间；基于音频处理结果，完成音素与口型的对应。3.根据权利要求2所述的一种播报数字人形态生成与控制方法，其特征在于，还包括对音素对应的口型进行平滑处理，平滑方法采用时序滤波，滤波器的长度根据帧率不同。4.根据权利要求1所述...

【专利技术属性】
技术研发人员：王晨，任夏楠，张乐，孙明超，张超，李良，潘昊天，
申请(专利权)人：山东未来融媒体有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人