一种基于大规模预训练语言模型的数字人生成系统技术方案

技术编号：40872145 阅读：24 留言：0更新日期：2024-04-08 16:39

本发明专利技术公开一种基于大规模预训练语言模型的数字人生成系统，涉及虚拟数字人技术领域，该系统包括：服务器和全息显示模块；服务器包括专属大模型生成模块、预设动作几何模型生成模块、数字人形象生成模块和个性化数字人生成模块；专属大模型生成模块用于采用定制化数据集对大规模预训练语言模型进行微调得到专属大模型；预设动作几何模型生成模块用于对目标人员进行静态扫描建模得到多个预设动作几何模型；数字人形象生成模块用于根据多个预设动作几何模型生成数字人形象；个性化数字人生成模块用于将专属大模型、定制化语音和动作加载到数字人形象。本发明专利技术实现了通过个性化数字人生成模块生成通过全息显示模块显示的个性化数字人。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及虚拟数字人，特别是涉及一种基于大规模预训练语言模型的数字人生成系统。

技术介绍

1、目前随着大规模预训练语言模型（large-scale pretrained language model）的不断发展，越来越多的行业开始基于开源的大规模预训练语言模型进行微调，并应用到垂直细分行业，并取得了突破性的成果。其中，通过对自然语言处理任务中，对于自然流畅文本的生成，把一种语言翻译成另外一种语言，理解问题并给出准确的答案，判断文本情感等领域均取得了重大的突破。而对于大语言模型与多模态的融合是提升数字人形象的重要方法，通过对大语言模型的微调与实际应用场景的结合。

2、各种基于大规模预训练语言模型微调的生成式应用最近一顿时间迅猛发展起来，从文字、声音、图像、视频等场景的生成应用层出不穷，而融合人工智能生成的内容（artificial intelligence generated content，aigc）生成出来的数字人虚拟形象，在短视频平台、元宇宙或者增强现实（augmented reality，ar）/虚拟现实（virtual realit本文档来自技高网...

【技术保护点】

1.一种基于大规模预训练语言模型的数字人生成系统，其特征在于，包括：服务器和与所述服务器连接的全息显示模块；所述服务器包括专属大模型生成模块、预设动作几何模型生成模块、数字人形象生成模块和个性化数字人生成模块；

2.根据权利要求1所述的基于大规模预训练语言模型的数字人生成系统，其特征在于，所述定制化数据集包括多个子集，多个子集包括文本数据子集和语料子集，每个子集中样本数据均包括输入数据和标签数据。

3.根据权利要求1所述的基于大规模预训练语言模型的数字人生成系统，其特征在于，所述专属大模型生成模块训练单元和测试单元；所述训练单元用于利用所述定制化数据集对所述大规模...

【技术特征摘要】

3.根据权利要求1所述的基于大规模预训练语言模型的数字人生成系统，其特征在于，所述专属大模型生成模块训练单元和测试单元；所述训练单元用于利用所述定制化数据集对所述大规模预训练语言模型进行训练；所述测试单元用于对所述训练单元输出的训练过的大规模预训练语言模型进行测试，若测试结果满足设定条件，则将训练过的大规模预训练语言模型作为所述专属大模型输出。

4.根据权利要求1所述的基于大规模预训练语言模型的数字人生成系统，其特征在于，预设动作几何模型生成模块包括...

【专利技术属性】
技术研发人员：刘丽，
申请(专利权)人：北京烽火万家科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人