【技术实现步骤摘要】
本申请涉及电力检修和大语言模型应用,更具体地,涉及一种基于大语言模型的检修冲突处理方法及系统。
技术介绍
1、电网检修任务中的文档处理与命名实体识别是一个复杂且具有挑战性的任务。随着电网运维规模的不断扩大,电网检修文档的数量也日益增多,如何从中有效提取关键信息,尤其是对检修任务中的实体进行精准识别,成为提升电网运维效率的关键。目前,传统的文本处理方法主要依赖手工构建的词典和规则,但这种方法在实际应用中往往缺乏灵活性,且无法适应电网检修领域中的专业术语和复杂的上下文环境。因此,亟需一种更为高效且适应性强的方法来应对这些挑战。
2、近年来,大语言模型(如gpt系列、claude等)的发展为文本处理任务提供了新的解决方案。这些模型凭借强大的语言理解和生成能力,在命名实体识别、语义匹配等领域取得了显著的效果。通过优化提示词模板和构建领域特定的语义模型,可以大幅提升命名实体识别的准确性,尤其是在电网检修等专业领域。
3、尽管当前的研究成果为电网检修领域的文本处理提供了有效的解决方案,但如何进一步提高处理的准确性与效率,尤其是在多领域、多源数据融合的背景下,仍然是当前技术亟待突破的难题。因此,如何利用大语言模型的优势结合电网检修的实际需求,成为了该领域技术研究的一个重要方向。
4、现有技术如公开号为“cn113157860a”的中国专利申请公开了一种基于小规模数据的电力设备检修知识图谱构建方法,该方法包括以下步骤:爬取知识百科网站,构建电力基础语料数据集,所述电力基础语料数据集中至少包括检修手册和根据检修
5、上述现有技术存在的问题是,在实体识别精度与适应性、文档处理效率、冲突处理能力等方面存在不足。具体表现为缺乏优化提示词模板与多模型机制,实体识别精度受限;缺少语义一致性分割方法和向量数据库,文档处理效率低;无法自动识别调解冲突及有效整合跨文档信息,冲突处理能力有限。
技术实现思路
1、为解决上述技术问题,本专利技术提出了一种基于大语言模型的检修冲突处理方法及系统。
2、本专利技术技术方案如下:
3、本专利技术提出一种基于大语言模型的检修冲突处理方法,包括以下步骤:
4、步骤s1,收集电网检修文档构建电网检修领域词表;根据电网检修文档中的任务场景设置提示词模板;
5、步骤s2,根据电网检修领域词表和语义一致原则,对电网检修文档进行分割,将分割后的文档转换为高维语义向量,构成电网检修领域的向量数据库;
6、步骤s3,在向量数据库匹配输入电网检修文档相关内容并加入提示词模板,借助多个大语言模型生成命名实体提取结果;
7、步骤s4,根据大语言模型生成命名实体提取结果,把不同电网检修文档实体替换为对应的实体类型,构建谓词接近图,用大语言模型对比关系语义类型对齐谓词;
8、步骤s5,运用知识图谱嵌入transe方法生成实体的向量表示,将不同图谱实体嵌入对齐到同一空间并判断对应关系,通过联合学习策略统一各嵌入到优化框架中;
9、步骤s6,基于提示词模板和领域词表识别电网检修文档实体并提取冲突信息,结合多模型机制整合冲突信息,对不同检修任务中相关实体的对齐与语义理解,实现检修任务间的冲突识别与调解。
10、作为优选实施方式,所述收集电网检修文档构建电网检修领域词表,其中,电网检修文档包括:检修计划、检修方案和故障分析记录;电网检修领域词表包含多个实体类别,具体包括:设备名称、检修日期、故障位置、故障类型和检修负责人。
11、作为优选实施方式,所述根据电网检修文档中的任务场景设置提示词模板过程中,根据电网检修任务场景,初步设计通用提示词模板,并采用策略梯度算法优化提示词模板,策略梯度算法的奖励函数公式如下:
12、
13、式中:r表示奖励函数;π表示决策函数;t表示时间总步数;t表示当前时间步;γ表示折扣因子;r表示即时奖励,根据提示词模板提取结果准确性评分得到。
14、作为优选实施方式,所述根据电网检修领域词表和语义一致原则,对电网检修文档进行分割,具体为,结合电网检修领域词表利用词频-逆文档频率tf-idf规则提取电网检修文档中的标题和关键句子,并使用bert模型对电网检修文档段落进行语义向量化,相邻两个段落相似度小于预设值则进行分割;其中,相邻两个段落相似度相似度计算公式如下:
15、
16、式中:pi、pj分别表示相邻两个段落对应的高维向量。
17、作为优选实施方式,所述在向量数据库匹配输入电网检修文档相关内容并加入提示词模板,借助多个大语言模型生成命名实体提取结果,通过投票原则对多个大语言模型生成命名实体提取结果进行筛选,投票原则的具体计算公式如下:
18、
19、式中:rfinal表示最终被选定的最优提取结果;δ(rn,ab)表示第n个大语言模型的提取结果与第b个候选结果ab是否一致;n为大语言模型的总数;argmax为求最大值操作。
20、作为优选实施方式,所述用大语言模型对比关系语义类型对齐谓词,包含以下步骤:
21、计算谓词向量:
22、
23、式中:u为谓词向量;wm表示第m个实体类型的谓词权重;zm表示第m个实体类型的嵌入;m为实体类型的总数;
24、谓词向量相似度计算,采用余弦相似度,计算公式如下:
25、
26、式中:u1、u2表示不同电网检修文档中的两个谓词向量。
27、作为优选实施方式,所述运用知识图谱嵌入transe方法生成实体的向量表示,将不同图谱实体嵌入对齐到同一空间并判断对应关系,通过联合学习策略统一各嵌入到优化框架中,具体包含以下步骤:
28、使用知识图谱嵌入transe方法为电网检修文档中的实体生成向量表示,对于每个实体的三元组<h,p,q>,计算其实体的嵌入,计算公式如下:
29、f(<h,p,t>)=∥h+p-t∥2;
30、式中:h表示头实体;p表示关系谓词;q表示尾实体;∥·∥2表示l2范数;
31、采用lstm嵌入技术对实体属性进行建模,具体公式如下:
32、fa(v)=lstm(c1,c2,...,cv);
33、式中:fa(v)表示对实体属性v的建模结果;lstm表示长短期记忆网络操作;c1,c2,...,cv表示实体属性v的字符序列;
本文档来自技高网...【技术保护点】
1.一种基于大语言模型的检修冲突处理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于大语言模型的检修冲突处理方法,其特征在于:所述收集电网检修文档构建电网检修领域词表,其中,电网检修文档包括:检修计划、检修方案和故障分析记录;电网检修领域词表包含多个实体类别,具体包括:设备名称、检修日期、故障位置、故障类型和检修负责人。
3.根据权利要求1所述的一种基于大语言模型的检修冲突处理方法,其特征在于:所述根据电网检修文档中的任务场景设置提示词模板过程中,根据电网检修任务场景,初步设计通用提示词模板,并采用策略梯度算法优化提示词模板,策略梯度算法的奖励函数公式如下:
4.根据权利要求1所述的一种基于大语言模型的检修冲突处理方法,其特征在于:所述根据电网检修领域词表和语义一致原则,对电网检修文档进行分割,具体为,结合电网检修领域词表利用词频-逆文档频率TF-IDF规则提取电网检修文档中的标题和关键句子,并使用BERT模型对电网检修文档段落进行语义向量化,相邻两个段落相似度小于预设值则进行分割;其中,相邻两个段落相似度相似度计算公式如下:
5.根据权利要求1所述的一种基于大语言模型的检修冲突处理方法,其特征在于:所述在向量数据库匹配输入电网检修文档相关内容并加入提示词模板,借助多个大语言模型生成命名实体提取结果,通过投票原则对多个大语言模型生成命名实体提取结果进行筛选,投票原则的具体计算公式如下:
6.根据权利要求1所述的一种基于大语言模型的检修冲突处理方法,其特征在于:所述用大语言模型对比关系语义类型对齐谓词,包含以下步骤:
7.根据权利要求1所述的一种基于大语言模型的检修冲突处理方法,其特征在于:所述运用知识图谱嵌入TransE方法生成实体的向量表示,将不同图谱实体嵌入对齐到同一空间并判断对应关系,通过联合学习策略统一各嵌入到优化框架中,具体包含以下步骤:
8.一种基于大语言模型的检修冲突处理系统,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的一种基于大语言模型的检修冲突处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7任一项所述的一种基于大语言模型的检修冲突处理方法。
...【技术特征摘要】
1.一种基于大语言模型的检修冲突处理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于大语言模型的检修冲突处理方法,其特征在于:所述收集电网检修文档构建电网检修领域词表,其中,电网检修文档包括:检修计划、检修方案和故障分析记录;电网检修领域词表包含多个实体类别,具体包括:设备名称、检修日期、故障位置、故障类型和检修负责人。
3.根据权利要求1所述的一种基于大语言模型的检修冲突处理方法,其特征在于:所述根据电网检修文档中的任务场景设置提示词模板过程中,根据电网检修任务场景,初步设计通用提示词模板,并采用策略梯度算法优化提示词模板,策略梯度算法的奖励函数公式如下:
4.根据权利要求1所述的一种基于大语言模型的检修冲突处理方法,其特征在于:所述根据电网检修领域词表和语义一致原则,对电网检修文档进行分割,具体为,结合电网检修领域词表利用词频-逆文档频率tf-idf规则提取电网检修文档中的标题和关键句子,并使用bert模型对电网检修文档段落进行语义向量化,相邻两个段落相似度小于预设值则进行分割;其中,相邻两个段落相似度相似度计算公式如下:
5.根据权利要求1所述的一种基于大语言模型的检修...
【专利技术属性】
技术研发人员:李昂,梅峰,孙望舒,谢科军,高文俊,陈熙,寿定炀,
申请(专利权)人:安徽继远软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。