面向预训练大语言模型调优的立法规划意图识别方法技术

技术编号：39503515 阅读：9 留言：0更新日期：2023-11-24 11:34

本发明专利技术公开了一种面向预训练大语言模型调优的立法规划意图识别方法，获得立法规划计划意见文本信息，得到立法规划计划意见知识本体；通过遍历立法规划计划意见知识本体生成设计自然语言形式的预训练大语言模型调优指令生成函数；调用大语言模型调优提示指令生成函数

全部详细技术资料下载

【技术实现步骤摘要】
面向预训练大语言模型调优的立法规划意图识别方法

[0001]本专利技术属于人工智能和自然语言处理
，特别是涉及一种面向知识增强的预训练大语言模型信息抽取的立法规划
/
计划意图识别方法
。

技术介绍

[0002]为了更好地实现立法规划和计划的制定，需要对于海量的各类意见文本进行综合分类，通过信息抽取技术来智能识别各种意见文本
。
意见文本往往包括大数据类型的各种与观点相关的文本数据
。
面对如此众多种类的意见文本数据，如何进行有效的抽取和评估变得尤为重要
。
传统的方式常常需要耗费大量时间和人力进行手动梳理和整理
。
随着人工智能技术的逐步应用，信息抽取可以通过自然语言处理技术来对于各类意见的要素进行智能识别
。
以下对现有技术中与本专利技术相关联的信息抽取和意图识别进行详细描述：
[0003]信息抽取方法包括实体和关系的抽取方法
、
事件抽取方法和联合信息抽取方法
。
其中，
(1)
实体和关系的抽取方法具体分为：
①
基于规则模板的方法
(Rule
‑
Based Methods)
，通过手动制定各种规则和模板来识别实体和它们之间的关系，依赖于人工制定的规则和特征，难以扩展到更广泛的领域，并且无法有效处理规则冲突和复杂的语言结构，难以适应大规模的和复杂的语料数据集
。
②
基于特...

【技术保护点】

【技术特征摘要】
1.
一种面向预训练大语言模型调优的立法规划意图识别方法，其特征在于，包括：步骤
1、
获得立法规划计划意见文本信息，根据所述文本信息中的概念及其关系得到层次结构化的类和属性，形成立法规划计划意见知识本体
S
；步骤
2、
遍历步骤1得到的所述立法规划计划意见知识本体
S
，解析得到类的集合
C
和待处理的文本
T
，设置自然语言形式的
LLM
调优提示指令生成函数
(S,C,T)
，所述大语言模型调优提示指令生成函数
(S,C,T)
如下式所示：
LLM
调优指令生成函数
(S,C,T))
＝
[LLM
能力设定提示
]+[
类和属性遍历模板
(S,C)]+[
小样本举例
(C)]+[
引入输入文本提示
]+T+[LLM
输出启动提示
]
其中，
LLM
能力设定提示为大语言模型的要素抽取能力设定的提示指令，
LLM
输出启动提示为大语言模型的输出启动的提示指令；步骤
3、
将待处理的法律法规长文本分割成若干切割文档，所述切割文档输入大语言模型，利用大语言模型对每个切割文档进行分别摘要，抽取立法规划计划意见各类要素，批量生成与切割文档对应的摘要文档，按顺序进行所述摘要文档拼接，形成立法规划计划意见简写文本，将立法规划计划意见简写文本输入下一级大语言模型，同时调用执行步骤2的所述大语言模型调优提示指令生成函数
(S,C,T)
，输出对立法规划计划意见长文本的立法意图的调优识别和摘要生成
。2.
如权利要求1所述的一种面向预训练大语言模型调优的立法规划意图识别方法，其特征在于，所述步骤3支持多任务的预训练大语言模型调优指令生成函数，该函数基于引导词规则模板实现大语言模型针对不同任务的精调指令的批量生成
。3.
如权利要求1所述的一种面向预训练大语言模型调优的立法规划意图识别方法，其特征在于，包括查询遍历任意类属性
c
i
a
j
中的提示指令，针对特定实体
、
关系和事件的抽取任务批量生成面向多任务的大语言模型调优提示指令生成函数
(S,C,T)。4.
如权利要求1所述的一种面向预训练大语言模型调优的立法规划意图识别方法，其特征在于，进行形式化定义：
Classes(S)<...

【专利技术属性】
技术研发人员：梁鸿翔，王文俊，戴维迪，王博，陈雪，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人