System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于危化品事故应急处置的命名实体识别方法技术_技高网

一种用于危化品事故应急处置的命名实体识别方法技术

技术编号:40074958 阅读:6 留言:0更新日期:2024-01-17 00:58
本发明专利技术提供了一种用于危化品事故应急处置的命名实体识别方法,所述命名实体识别方法基于大语言模型实现的,该命名实体识别方法包括如下步骤:步骤S1、收集和处理针对危化品事故应急处置的数据集;步骤S2、利用所述数据集对大语言模型进行调整;步骤S3、设计命名实体识别模板,通过命名实体识别模板指导所述大语言模型进行关键实体的识别;步骤S4、建立输入接口,当相关文本被输入时,经过微调后的大语言模型能够自动识别并在命名实体识别模板中标注出关键实体;能准确的识别和提取危化品事故应急处置中的关键实体,对救援工作至关重要。

【技术实现步骤摘要】

本专利技术属于自然语言处理,具体涉及一种用于危化品事故应急处置的命名实体识别方法


技术介绍

1、危化品具有易燃、易爆、有毒、有害等危险特性,如果危化品库区仓储环境或者实验室存放了大量的危险品,但危险管理及使用不规范、管理范围受限制、无法实现实时监控时,将会导致危化品的事故的发生。

2、随着工业化的发展,危化品事故的风险逐渐增大。对于这类事故的应急处置,快速、准确地获取关键信息至关重要。传统的信息提取方法往往依赖于手工标注的数据,这不仅耗时,而且可能存在遗漏。因此,需要一种更高效、准确的技术来识别和提取危化品事故应急处置中的关键实体。

3、大语言模型(llm)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。这类模型的代表包括像gpt-3(generative pre-trainedtransformer 3)这样的模型。这些模型之所以称为“大”语言模型,是因为它们通常具有数十亿到数百亿个参数,使其具备强大的语言理解和生成能力。通过使用与危化品事故应急处置相关的文本数据。将这些数据提供给模型并进行监督学习,模型将学会识别和理解与危化品事故应急处置相关的特定信息,从而创建一个符合危化品应急处置需求的模型。


技术实现思路

1、为了解决上述问题,本专利技术提供了一种用于危化品事故应急处置的命名实体识别方法,能高效、准确的来识别和提取危化品事故应急处置中的关键实体,从而及时处理危化品事故。

2、本专利技术的技术方案如下:</p>

3、一种用于危化品事故应急处置的命名实体识别方法,所述命名实体识别方法基于大语言模型实现的,该命名实体识别方法包括如下步骤:

4、步骤s1、收集和处理针对危化品事故应急处置的数据集;

5、步骤s2、利用所述数据集对大语言模型进行调整;

6、步骤s3、设计命名实体识别模板,通过命名实体识别模板指导所述大语言模型进行关键实体的识别;

7、步骤s4、建立输入接口,当相关文本被输入时,经过微调后的大语言模型能够自动识别并在命名实体识别模板中标注出关键实体。

8、进一步的,所述数据集主要来源于政府、环境保护机构或工业安全机构发布的官方报告、媒体的新闻报道、关于危化品事故和应急响应的学术研究,以及应急响应团队之间的实时通讯记录;所述数据集包括:事故发生的时间、地点、原因、涉及的化学物质,以及应急响应的具体措施、涉及的团队和设备、应急计划的执行情况;在数据预处理阶段,还需要进行文本清洗、标准化、分词和标注,以确保数据的质量和一致性。

9、进一步的,所述步骤s2具体为:利用与危化品事故应急处置相关的数据集对大语言模型进行微调,所述大语言模型采用llama-2模型,在微调之前,首先对已处理的数据集进行划分,将数据集分为训练集、验证集和测试集;在微调过程中,模型参数会根据新的数据进行调整,以更准确地捕获与危化品事故应急处置相关的语言特征和知识;定义一个适用于命名实体识别的损失函数,损失函数的目标是最小化模型生成的命名实体与标签之间的差距;为了防止过度拟合,采用了adamw优化器;adamw优化器是adam优化器的一种变体,它引入了权重衰减以减少模型参数的大小,从而防止过度拟合;权重衰减通过在损失函数中添加正则化项来实现;为了确保模型能够快速收敛并保持稳定性,采用了学习率更新策略,初始学习率设置为0.001,并采用学习率衰减策略,每个训练周期结束后将学习率乘以0.9;这有助于在训练过程中逐渐减小学习率,以更精细地调整模型权重;微调过程分为多个训练周期,在每个周期内,将数据按批量进行前向传播和反向传播;,同时限制了模型输入序列的最大长度为16个标记;通过这个微调过程,将大语言模型适应危化品事故应急处置命名实体识别任务,并通过adamw优化器和学习率更新策略实现了稳定的性能提升。

10、进一步的,所述步骤s3具体为:设计命名实体识别模板prompt,在模板prompt设计阶段,首先明确危化品应急处置文本中需被识别的实体;接着,根据这些已确定的实体,来构建一个简明、直观的模板prompt,其中模板prompt包括代表各类实体的占位符。

11、进一步的,当输入相关文本至微调后的大语言模型时,识别并匹配文本中的关键实体和模板prompt中预定义的实体类别;接着,大语言模型将这些已识别的实体准确地填入模板prompt的对应位置,从而产生结构化的输出结果;采用公式为:

12、输入:is=prompt(x)

13、输出:

14、其中x为所输入文本;is则为经提示语整合文本;te为实体类型;le为实体内容,i为输出的文本结果。

15、进一步的,步骤s4中实体识别过程由“识别”和“再识别”两个阶段构成;

16、识别阶段:该阶段采用文本与大语言模型的多回合对话形式进行,在第一个回合中,大语言模型根据给定的提示语从危化品应急处置文本中识别实体,对于每个初步识别的实体,大语言模型会在随后的回合中使用新的提示语来验证其正确性;该阶段结束后,为每段文本生成一个初步的实体列表;

17、再识别阶段:该再识别阶段同样采用文本与大语言模型的多回合对话形式,基于识别阶段中已确定的实体,大语言模型在再识别的第一回合中尝试找出之前未被识别的实体;对于这些新识别的实体,大语言模型会在随后的回合中使用新的提示语进行验证;

18、最后,将“识别”和“再识别”两个阶段中得到的实体列表合并,形成最终的实体识别结果。

19、本专利技术是基于大语言模型的危化品事故应急处置的命名实体识别方法,该方法能更高效、准确的来识别和提取危化品事故应急处置中的关键实体,从而获取危化品事故应急处置的关键信息,从而进行及时地处理事故。

本文档来自技高网...

【技术保护点】

1.一种用于危化品事故应急处置的命名实体识别方法,其特征在于:所述命名实体识别方法基于大语言模型实现的,该命名实体识别方法包括如下步骤:

2.根据权利要求1所述的一种用于危化品事故应急处置的命名实体识别方法,其特征在于:所述数据集包括:事故发生的时间、地点、原因、涉及的化学物质,以及应急响应的具体措施、涉及的团队和设备、应急计划的执行情况;在数据预处理阶段,还需要进行文本清洗、标准化、分词和标注,以确保数据的质量和一致性。

3.根据权利要求1所述的一种用于危化品事故应急处置的命名实体识别方法,其特征在于:

4.根据权利要求1所述的一种用于危化品事故应急处置的命名实体识别方法,其特征在于:

5.根据权利要求4所述的一种用于危化品事故应急处置的命名实体识别方法,其特征在于:

6.根据权利要求1所述的一种用于危化品事故应急处置的命名实体识别方法,其特征在于:步骤S4中实体识别过程由“识别”和“再识别”两个阶段构成;

【技术特征摘要】

1.一种用于危化品事故应急处置的命名实体识别方法,其特征在于:所述命名实体识别方法基于大语言模型实现的,该命名实体识别方法包括如下步骤:

2.根据权利要求1所述的一种用于危化品事故应急处置的命名实体识别方法,其特征在于:所述数据集包括:事故发生的时间、地点、原因、涉及的化学物质,以及应急响应的具体措施、涉及的团队和设备、应急计划的执行情况;在数据预处理阶段,还需要进行文本清洗、标准化、分词和标注,以确保数据的质量和一致性。<...

【专利技术属性】
技术研发人员:郑耿峰杨天雪李智翔曾远跃陈嵩赵磊陈浩龙张昕
申请(专利权)人:福建省特种设备检验研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1