System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种心理领域数据生成、模型训练方法、装置及存储介质制造方法及图纸_技高网

一种心理领域数据生成、模型训练方法、装置及存储介质制造方法及图纸

技术编号:40957261 阅读:2 留言:0更新日期:2024-04-18 20:34
本发明专利技术人工智能技术领域,提供了一种心理领域数据生成、模型训练方法、装置及存储介质。目的在于解决目前缺乏有效的生成心理领域高质量对话数据生成和训练垂直领域大语言模型的方法。输入策略标注语料和开源数据集,构建马尔科夫链生成策略,去重并初始化话题和策略组列表,供多轮对话生成。通过策略匹配找到最相似对话案例,提供给专家级语言模型引导回复。定义模板并用案例、问题和策略填充,生成多轮对话并保存为心理领域数据集。训练大语言模型以适应心理领域多轮对话任务,采用特殊标识符、因果语言模型和加权平均损失函数提升专业度和针对性。

【技术实现步骤摘要】

本专利技术属于人工智能技术人机对话系统中的自然语言理解领域,提供了一种心理领域数据生成、模型训练方法、装置及存储介质


技术介绍

1、近年来,随着大规模语料库和硬件容量的迅速增长,研究人员发现通过扩大模型和训练数据的规模可以持续提高模型容量,这最终催生了大语言模型,如gpt-3(1750亿参数)、palm(5400亿参数)和llama(650亿参数)。 与较小模型相比,大语言模型在理解和生成文本方面表现显著,并逐渐成为热门的人工智能研究趋势。通过利用大语言模型进行高效的文献分析、复杂数据解释、文档写作等彻底改变了自然和社会科学的研究方法,并促进了跨学科合作。

2、虽然大语言模型在通用领域方面完成各式各样的任务具有巨大的潜力,但要有效地将其打造成一个能解决实际问题的“对话机器人”依然面临着巨大挑战。这就导致了“大语言模型领域专业化”的出现。具体而言,不同领域、角色和任务之间的对话和语言风格存在显著差异,比如从心理学疏导到法律咨询再到在线聊天等,不同场景下对大语言模型回复的针对性、专业度要求不一,某些场景需要丰富的过往案例经验,而某些场景需要深入理解专业的复杂理论知识。此外,此外,不同领域、机构和团队面对不同的业务有着自己的“商业模型”,单一通用的大语言模型没有办法直接有效地解决特定领域下的问题。其次,许多场景下对领域知识要求深入、实时和准确,且这些领域知识资源是机构、组织专有的资产和核心竞争力,绝对不能泄露给通用的大语言模型。

3、下游任务学习(downstream task learning)是大语言模型领域专业化的常用做法,领域专业化以后的大语言模型能更好地适用于特定的任务以及集成到应用程序。

4、如图5所示,大语言模型领域专业化的方法可以分为三类:外部增强(externalaugmentation)、提示设计(prompt crafting)和模型微调(model fine-tuning)。其中,模型微调可以给大语言模型带来最为显著的性能提升,该方法需要基于一个较小量级、特定领域的数据集上进行模型训练。最新研究表明采用模仿学习的方式,可以使开源的小规模的大语言模型“汲取”闭源的专家级大语言模型(如chatgpt)的知识,即通过提示工程挖掘性能优越的专家级大语言模型内蕴含的知识,然后再让性能次一点小规模大语言模型学习这些知识,从而提升模型在特有任务上的表现。开源的小规模大语言模型(参数量7b左右)在硬件需求、算力成本、工程优化难度等方面都比更通用的大模型更具有优势,通过模仿学习,仅需少量的资金成本就可以打造一个在特定任务上和闭源的专家级大语言模型匹敌的私有化模型,从而实现大语言模型领域专业化。而随着社会压力的增加、信息传播的快速以及家庭结构的变化,青少年的心理健康问题逐渐引起了广泛关注。青少年面临着诸多挑战,包括学业压力、人际关系、身体形象等问题,这些都可能对其心理健康产生负面影响。因此,利用先进的人工智能技术在校园中进行心理健康风险普查并为风险对象提供智能的心理疏导服务成为一项迫切的需求。

5、将人工智能技术应用于心理疏导服务是一个不小的挑战,现有的心理疏导服务主要基于预先定义好的对话路径和语料库引导和回复用户,显著降低了疏导的灵活性,缺乏情感理解能力和共情能力。而通用领域大语言模型直接用于心理疏导缺乏针对性和专业性,打造心理领域专业化的大语言模型用于心理疏导服务则缺乏足量的高质量对话标注数据,这些标注数据依赖于耗时、昂贵的人力。时至今日,仍然缺乏有效地生成高质量心理领域对话数据和训练心理领域专业大语言模型的方法。

6、现有技术的缺陷主要体现在以下几个方面:

7、1. 通用性不足:大语言模型虽然具有巨大的通用性,但在理解和生成特定领域的文本时,其表现仍然存在显著的不足。这导致了在实际应用中,大语言模型往往需要进行领域专业化,以提高其在特定任务上的表现。然而,领域专业化过程复杂且耗时,且不同领域、角色和任务之间的对话和语言风格存在显著差异,这使得大语言模型在通用领域的应用受到限制。

8、2. 针对性不足:通用大语言模型在特定领域的问题解决能力不足,需要进行领域专业化。然而,不同领域、机构和团队面对不同的业务有着自己的“商业模型”,单一通用的大语言模型没有办法直接有效地解决特定领域下的问题。此外,许多场景下对领域知识要求深入、实时和准确,且这些领域知识资源是机构、组织专有的资产和核心竞争力,绝对不能泄露给通用的大语言模型。

9、3. 数据标注问题:心理领域的高质量对话标注数据不足,这使得在心理疏导服务中,大语言模型难以得到充分地训练和优化。这些标注数据依赖于耗时、昂贵的人力,且难以获取。因此,如何有效地生成高质量心理领域对话数据和训练心理领域专业大语言模型,成为了当前亟待解决的问题。


技术实现思路

1、本专利技术的目的在于解决目前在心理领域缺乏有效的生成高质量对话数据生成和训练垂直领域大语言模型的方法。提示工程是挖掘大语言模型知识的常用方法,通过编写合适的提示可以引导闭源的专家级大语言模型生成语料,本专利技术设计了一种基于少量的高质量标注语料和专家级大语言模型自动生成高质量心理领域对话语料的方法,并设计了一种融合向量空间距离损失和交叉熵损失函数训练心理领域大语言模型。

2、本专利技术为了解决上述技术问题,采用以下技术手段:

3、本专利技术提供了一种心理领域数据生成、模型训练方法,包括以下步骤:

4、步骤1.策略模拟步骤:

5、输入策略标注语料和开源数据集,然后通过构建马尔科夫链模拟人工标注生成策略,接着对开源数据集进行去重,然后初始化话题列表和策略组列表,最后将话题列表和策略组列表输出到多轮对话生成步骤。

6、步骤2.对话案例检索步骤:

7、输入策略组和问题,然后通过策略匹配找到相似的候选对话案例,接着,对候选对话案例和问题进行编码,并计算它们之间的余弦相似度,以找到最匹配的对话案例作为样本;最后,将找到的最匹配的对话案例作为样本,提供给多轮对话生成步骤的专家级大型语言模型作为参考案例,以更好地引导其生成回复。

8、步骤3.多轮对话生成步骤:

9、定义模板,然后用对话案例检索步骤输出的对话案例、用户的问题和基于马尔科夫链生成的策略对模板进行填充内容后输入大语言模型,生成多轮对话,保存数据,形成心理领域多轮对话数据集;

10、步骤4.模型训练步骤:

11、基于多轮对话数据训练大语言模型,以适应心理领域多轮对话任务,通过添加特殊标识符区分对话数据的不同部分,并使用因果语言模型保持生成的因果关系,通过向量空间距离损失函数与交叉熵损失函数的加权平均损失函数,以提升模型在心理领域对话的专业度,通过计算损失并进行加权平均,训练模型预测回复策略和回答,使其在心理领域问题上更具专业性和针对性。

12、上述技术方案中,策略模拟步骤具体包括以下步骤:

13、步骤2.1.输入策略标注语料和开源数据集;

本文档来自技高网...

【技术保护点】

1.一种心理领域数据生成、模型训练方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种心理领域数据生成、模型训练方法,其特征在于,策略模拟步骤具体包括以下步骤:

3.根据权利要求1所述的一种心理领域数据生成、模型训练方法,其特征在于,对话案例检索步骤,具体包括以下步骤:

4.根据权利要求3所述的一种心理领域数据生成、模型训练方法,其特征在于,在策略匹配单元中,通过计算两组策略的最小编辑距离来判断二者的相似度。

5.根据权利要求3所述的一种心理领域数据生成、模型训练方法,其特征在于,在策略匹配单元中,采用动态规划的方式在策略标注语料中搜寻与输入策略相似的策略,具体步骤包括:

6.根据权利要求3所述的一种心理领域数据生成、模型训练方法,其特征在于,多轮对话数据生成步骤具体包括以下步骤:

7.根据权利要求1所述的一种心理领域数据生成、模型训练方法,其特征在于,模型训练步骤具体包括以下步骤:

8.一种心理领域数据生成、模型训练装置,其特征在于,包括以下模块:

9.一种存储介质,其特征在于,处理器在执行存储介质中存储的程序时,实现如权利要求1-7任一所述的一种心理领域数据生成、模型训练方法。

...

【技术特征摘要】

1.一种心理领域数据生成、模型训练方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种心理领域数据生成、模型训练方法,其特征在于,策略模拟步骤具体包括以下步骤:

3.根据权利要求1所述的一种心理领域数据生成、模型训练方法,其特征在于,对话案例检索步骤,具体包括以下步骤:

4.根据权利要求3所述的一种心理领域数据生成、模型训练方法,其特征在于,在策略匹配单元中,通过计算两组策略的最小编辑距离来判断二者的相似度。

5.根据权利要求3所述的一种心理领域数据生成、模型训练方法,其特征在于,在策略匹...

【专利技术属性】
技术研发人员:唐天驰刘昌松刘胜坤张汝民
申请(专利权)人:广东数业智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1