基于大语言模型的突发事件应急预案生成系统及生成方法技术方案

技术编号:40598436 阅读:48 留言:0更新日期:2024-03-12 22:01
本发明专利技术提出了一种基于大语言模型的突发事件应急预案生成方法,包括如下步骤:S1、针对应急预案文档特性,构建标准应急预案文档结构,并针对各个章节分别设计合理的生成指令;S2、对已有应急预案文档进行分析,结合指令构建训练数据集;S3、采用构建的数据集,对大模型进行领域微调;S4、对各行业、各类突发事件应急预案,进行文档分割并构建应急预案向量库,以便在预案生成阶段,将更加专业的信息引入其中;S5、采用微调后的大模型,结合应急预案向量库,根据需求进行应急预案生成。本发明专利技术的主要目的在于采用大语言模型,构建应急行业数据并进行模型微调,对应急预案文档进行分析,针对不同地区、事件、领域以生成完整专业的应急预案文档。

【技术实现步骤摘要】

本专利技术涉及应急预案生成的,具体涉及一种基于大语言模型的突发事件应急预案生成系统及生成方法


技术介绍

1、目前,大模型在自然语言处理领域已经取得了较大的突破,特别是在智能问答、代码生成等方向,有着广泛地应用前景。但针对特定行业的长文本生成,往往无法形成规范化、直接可用的专业性强的文档,对于专业文档的撰写还是需要人工进行,这在需要编写大批量相似文档的场景下,无法发挥大模型生成特长,提高效率。

2、现在对各企业、高校等的应急事件突发处置要求越来越严格,许多企业都需要根据自己公司及行业特性编制多个突发事件应急预案,工作量大,内容繁杂,十分适合采用大语言模型进行生成。而现有的大语言模型通常是针对开放领域进行训练的,在特定行业长文本生成时,往往存在着答案内容宽泛,与地区、行业关联度差等问题,另外,答案的长度往往受限于硬件设备的性能,无法生成内容较长、格式规范、内容专业的完整文本,造成了生成的文本需要经过二次加工,无法直接使用的问题。

3、针对现有技术存在的问题和缺陷,亟需一种基于大语言模型的突发事件应急预案生成系统和生成方法,能够根据需求本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的突发事件应急预案生成方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于大语言模型的突发事件应急预案生成方法,其特征在于,所述S1中,为保证生成内容的准确性和文档的完整性,需要先规定应急预案文档结构及章节名称,再根据章节信息,依次根据章、小节信息以及用户输入的待生成应急预案类型等信息,构建较为固定的指令,用以应急预案的生成。

3.根据权利要求1所述的基于大语言模型的突发事件应急预案生成方法,其特征在于,所述S2中,通过从已有的各行业应急预案文档中,针对不同事件类型,对应急预案各个章节的内容构建问答数据集,构建时,指令需要与S1中构...

【技术特征摘要】

1.一种基于大语言模型的突发事件应急预案生成方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于大语言模型的突发事件应急预案生成方法,其特征在于,所述s1中,为保证生成内容的准确性和文档的完整性,需要先规定应急预案文档结构及章节名称,再根据章节信息,依次根据章、小节信息以及用户输入的待生成应急预案类型等信息,构建较为固定的指令,用以应急预案的生成。

3.根据权利要求1所述的基于大语言模型的突发事件应急预案生成方法,其特征在于,所述s2中,通过从已有的各行业应急预案文档中,针对不同事件类型,对应急预案各个章节的内容构建问答数据集,构建时,指令需要与s1中构建的指令一致。

4.根据权利要求1所述的基于大语言模型的突发事件应急预案生成方法,其特征在于,所述s3中,采用lora对大模型进行微调,通过lora对大型模型的权重矩阵进行隐式的低秩转换;并且保留原有预训练网络模型不变,在其旁边增加一个旁路结构,通过低秩分解来模拟参数的更新量,该结构由a,b两部分构成,如下公式(1)所示:

5.根据权利要求1所述的基于大语言模型的...

【专利技术属性】
技术研发人员:朱安安邱彦林李华松
申请(专利权)人:深蓝感知杭州物联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1