用于认知实体合成的生成性角色引擎制造技术

技术编号：39432399 阅读：13 留言：0更新日期：2023-11-19 16:16

公开了一种用于认知实体合成的生成性角色引擎。其首先收集文本数据作为训练语料库，接着，构建大语言模型，以预测下一个词的概率分布，然后，对所述大语言模型进行初始参数设定以得到预训练完成的大语言模型，最后，对所述预训练完成的大语言模型进行训练。这样，可以保持高质量的输出并确保对话符合角色设定。以保持高质量的输出并确保对话符合角色设定。以保持高质量的输出并确保对话符合角色设定。

全部详细技术资料下载

【技术实现步骤摘要】
用于认知实体合成的生成性角色引擎

[0001]本公开涉及角色引擎领域，且更为具体地，涉及一种用于认知实体合成的生成性角色引擎
。

技术介绍

[0002]随着人工智能技术的发展，越来越多的应用场景需要生成具有认知实体的角色，例如游戏
、
教育
、
娱乐等
。
这些角色不仅需要具有丰富的语言表达能力，还需要具有一定的个性
、
情感和知识
。
[0003]生成性角色引擎是一种用于认知实体合成的技术引擎，可以通过特定的训练数据对轻量级语言模型进行微调以生成角色设定的对话
。
然而，当下所有的大语言模型或多或少都存在幻觉问题
。
为了保持高质量的输出并确保对话符合角色设定，期待一种解决方案
。

技术实现思路

[0004]有鉴于此，本公开提出了一种用于认知实体合成的生成性角色引擎，其可以保持高质量的输出并确保对话符合角色设定
。
[0005]根据本公开的一方面，提供了一种用于认知实体合成的生成性角色引擎，其包括：数据准备模块，用于收集文本数据作为训练语料库；模型构建模块，用于构建大语言模型，以预测下一个词的概率分布；预训练模块，用于对所述大语言模型进行初始参数设定以得到预训练完成的大语言模型；以及训练模块，用于对所述预训练完成的大语言模型进行训练
。
[0006]根据本公开的实施例，其首先收集文本数据作为训练语料库，接着，构建大语言模型，以预测下一个词的概...

【技术保护点】

【技术特征摘要】
1.
一种用于认知实体合成的生成性角色引擎，其特征在于，包括：数据准备模块，用于收集文本数据作为训练语料库；模型构建模块，用于构建大语言模型，以预测下一个词的概率分布；预训练模块，用于对所述大语言模型进行初始参数设定以得到预训练完成的大语言模型；以及训练模块，用于对所述预训练完成的大语言模型进行训练
。2.
根据权利要求1所述的用于认知实体合成的生成性角色引擎，其特征在于，所述训练模块，包括：训练语料库获取单元，用于获取针对于特定角色的所述训练语料库；大语言模型获取单元，用于获取所述预训练完成的大语言模型；以及模型训练单元，用于基于所述训练语料库对所述预训练完成的大语言模型进行训练
。3.
根据权利要求2所述的用于认知实体合成的生成性角色引擎，其特征在于，所述模型训练单元，包括：预处理和提取子单元，用于对所述训练语料库进行数据预处理与输入序列提取以得到输入训练文本词嵌入向量的序列；损失函数值获取子单元，用于将所述输入训练文本词嵌入向量的序列通过所述预训练完成的大语言模型以得到交叉熵损失函数值；以及损失训练子单元，用于以所述交叉熵损失函数值作为损失函数值对所述预训练完成的大语言模型进行训练
。4.
根据权利要求3所述的用于认知实体合成的生成性角色引擎，其特征在于，所述预处理和提取子单元，包括：文本向量化二级子单元，用于对所述训练语料库进行数据预处理和文本向量化以得到训练文本词嵌入向量的序列；以及输入向量提取二级子单元，用于从所述训练文本词嵌入向量的序列中提取所述输入训练文本词嵌入向量的序列

【专利技术属性】
技术研发人员：王金鹏，贾新宇，李玉全，
申请(专利权)人：杭州谦贞数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人