一种针对2D数字人的视频生成算法及系统技术方案

技术编号：40494591 阅读：9 留言：0更新日期：2024-02-26 19:23

本发明专利技术公开了一种针对2D数字人的视频生成算法及系统，算法包括使用计算机图像深度学习技术输入的模特身材图像进行检测，获取模特的上半身区域图像；使用声音编码器进行原始音频进行音频特征提取；使用图像分割算法对模特的上半身区域图像进行分割，获取人脸区域与躯干区域；将获取的人脸区域，使用人脸关键点检测算法检测人脸区域，获取人脸关键点信息和人脸眨眼信息；将获取的人脸关键点信息、人脸眨眼信息和提取到的音频特征信息对神经辐射场模型进行训练；将实时采集的模特身材图像输入到训练好的神经辐射场模型中生成视频。优点是：解决了现有技术中嘴型生成不清晰的问题，能达到更为真实的2d数字人效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频生成，尤其涉及一种针对2d数字人的视频生成算法及系统。

技术介绍

1、2d数字人在电影、电子游戏等领域有着极大用处，2d数字人可以实现各种创意和想象，提供更丰富、更灵活的艺术表现形式。

2、目前市场上主流的2d数字人生成算法是wav2lip算法，该算法生成的2d数字人面部模糊，生成的嘴型对中文支持的不好，整体的2d数字人效果不真实。

技术实现思路

1、本专利技术的目的在于提供一种针对2d数字人的视频生成算法及系统，从而解决现有技术中存在的前述问题。

2、为了实现上述目的，本专利技术采用的技术方案如下：

3、一种针对2d数字人的视频生成算法，包括如下步骤，

4、s1、身躯检测：

5、使用计算机图像深度学习技术输入的模特身材图像进行检测，获取模特的上半身区域图像；

6、s2、音频提取：

7、使用声音编码器进行原始音频进行音频特征提取；

8、s3、人像分割：

9、使用图像分割算法对模特的上半身区域图像进行分割，获取人脸区域与躯干区域；

10、s4、人脸关键信息提取：

11、将获取的人脸区域，使用人脸关键点检测算法检测人脸区域，获取人脸关键点信息和人脸眨眼信息；

12、s5、模型训练：

13、将获取的人脸关键点信息、人脸眨眼信息和提取到的音频特征信息对神经辐射场模型进行训练；

14、s6、视频生成：

...

【技术保护点】

1.一种针对2D数字人的视频生成算法，其特征在于：包括如下步骤，

2.根据权利要求1所述的针对2D数字人的视频生成算法，其特征在于：步骤S1具体包括如下内容，

3.根据权利要求2所述的针对2D数字人的视频生成算法，其特征在于：每个边界框包含5个元素，分别为边界框中心相对于网格单元的横向偏移、边界框中心相对于网格单元的纵向偏移、边框的宽度、边框的高度和置信度。

4.根据权利要求1所述的针对2D数字人的视频生成算法，其特征在于：步骤S2具体包括如下内容，

5.根据权利要求1所述的针对2D数字人的视频生成算法，其特征在于：步骤S3具体包括如下内容，

6.根据权利要求5所述的针对2D数字人的视频生成算法，其特征在于：步骤S32中，使用跳跃连接将浅层特征和深层特征合并，以获取更丰富的语义和空间信息。

7.根据权利要求5所述的针对2D数字人的视频生成算法，其特征在于：步骤S33中，使用softmax函数计算每个类别的概率，选择概率最大的类别作为相应像素的预测类别。

8.根据权利要求1所述的针对2D数字人的视频

9.根据权利要求1所述的针对2D数字人的视频生成算法，其特征在于：步骤S5具体包括如下内容，

10.一种针对2D数字人的视频生成系统，其特征在于：系统能够实现上述权利要求1至9任一所述的算法，系统包括，

...

【技术特征摘要】

1.一种针对2d数字人的视频生成算法，其特征在于：包括如下步骤，

2.根据权利要求1所述的针对2d数字人的视频生成算法，其特征在于：步骤s1具体包括如下内容，

3.根据权利要求2所述的针对2d数字人的视频生成算法，其特征在于：每个边界框包含5个元素，分别为边界框中心相对于网格单元的横向偏移、边界框中心相对于网格单元的纵向偏移、边框的宽度、边框的高度和置信度。

4.根据权利要求1所述的针对2d数字人的视频生成算法，其特征在于：步骤s2具体包括如下内容，

5.根据权利要求1所述的针对2d数字人的视频生成算法，其特征在于：步骤s3具体包括如下内容，

6.根据权利要求5所述的针...

【专利技术属性】
技术研发人员：李璋，张华伟，
申请(专利权)人：新壹北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人