一种深度模拟人类性格的大语言模型塑造方法技术

技术编号:41533986 阅读:33 留言:0更新日期:2024-06-03 23:11
本发明专利技术公开了一种深度模拟人类性格的大语言模型塑造方法,属于自然语言处理技术领域。该方法的实施包括以下步骤:本地化部署开源大语言模型;搜集“大五人格”性格工程知识库并进行数据处理,创建豆瓣小组进行人格对话语料库收集,撰写性格工程提示词;高效参数LoRA微调大语言模型;通过LangChain组件连接知识库、提示词、微调后的人格大语言模型进行人格文本输出;基于“大五人格”评价标准通过对话语聊评估大语言模型模拟人类性格的实验效果。本发明专利技术解决了传统对话聊天机器人单调无趣,难以定制独特语言风格的问题。它旨在通过使用提示词设定角色结合文本嵌入方法,利用外部数据微调大语言模型,使大语言模型输出文本具有人类性格特点,从而构造出能改变深度模拟人类特定性格特点的大语言模型。这一发明专利技术在提供精准对话、情感陪伴、心理治疗和安慰等方面可以发挥良好的效果,同时在医疗领域落地应用中具有广泛前景。

【技术实现步骤摘要】

本专利技术涉及一种深度模拟人类性格的大语言模型塑造方法,属于自然语言处理。


技术介绍

1、大语言模型(largelanguagemodel,llm),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。它们主要涉及一种自然语言处理(nlp)技术,这是一种基于深度学习中的大规模预训练模型来训练语言模型的一种方法,通过在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。llm的出现,如chatgpt、chatglm等,让我们看到了人工智能的曙光,在过去,为解决一个个的小任务,我们需要花费大量的时间和精力去训练不同的小模型。而现在,这种情况正在发生改变,大模型具有很强的场景适应能力,它们可以通过学习上下文或少数样本的方式,使用少量的训练数据,做到快速泛化。如何使llm具有个性化的文本输出能力在行业落地场景中是一个有趣的课题,本专利技术提供了一种深度模拟人类性格的llm塑造方法,通过小数据样本塑造出可以具有人类性格特点的llm。


技术实现思路

1、本专利技术要解决的技术问题是:本文档来自技高网...

【技术保护点】

1.一种深度模拟人类性格的大语言模型(LLM)塑造方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述提示词、知识库、单轮对话数据集、多轮对话数据集均为基于“大五人格”理论特征进行构建。

3.根据权利要求1所述的方法,其特征在于,所述验证数据集可用性时,采用调查问卷的形式邀请熟练的数据工作者,对数据集是否真实反映了不同的大五人格类型的特点进行验证,剔除不合格的数据。

4.根据权利要求1所述的方法,其特征在于,所述高效参数微调LLM的方法为LoRA微调的方法,利用我们预先构建的单轮对话及多轮对话数据集采用LoRA微调的方式实现...

【技术特征摘要】

1.一种深度模拟人类性格的大语言模型(llm)塑造方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述提示词、知识库、单轮对话数据集、多轮对话数据集均为基于“大五人格”理论特征进行构建。

3.根据权利要求1所述的方法,其特征在于,所述验证数据集可用性时,采用调查问卷的形式邀请熟练的数据工作者,对数据集是否真实反映了不同的大五人格类型的特点进行验证,剔除不合格的数据。

4.根据权利要求1所述的方法,其特征在于,所述高效参数微调llm的方法为lora微调的方法,利用我们预先构建的单轮对话及多轮对话数据集采用lora微调的方式实现对llm的内部知识调整。

5...

【专利技术属性】
技术研发人员:赵玉良肖啟军吕晓永王婉越
申请(专利权)人:东北大学秦皇岛分校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1