【技术实现步骤摘要】
一种行为图谱创建生成方法及系统
[0001]本专利技术涉及知识图谱创建
,特别是涉及一种行为图谱创建生成方法及系统
。
技术介绍
[0002]知识图谱是一项相对常见的技术,当前,这项技术最常见的方案是依靠三元组架构,通过工具或人工辅助的方式,对知识图谱进行构架
。
这种方式由于无法摆脱人工辅助,因此图谱的创建成本高昂,导致无法以每个个案为单位创建图谱
。
[0003]有一种相对进一步的方式,就是直接依靠大模型对各个文档数据进行抽取,利用各个文档抽取出的信息直接构建个案的图谱,即现有是以文档信息为单位来构建个案图谱
。
现有并不存在利用文档信息先构建行为图谱
、
再基于行为图谱构建个案图谱的技术
。
因此,本专利技术不同于现有技术,采用了现有不存在的利用文档信息先构建行为图谱
、
再基于行为图谱构建个案图谱的技术
。
本专利技术重点描述利用文档信息构建行为图谱的技术
。
技术实现思路
r/>[0004]本本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种行为图谱创建生成方法,其特征在于,其包括以下步骤:
S1、
接收一案件的待处理案卷材料;
S2、
行业专用大模型利用提示词仓库中预定义的行为判断提示词解析待处理案卷材料,提取待处理案卷材料中包括的行为,若提取出至少一个行为则进入步骤
S3
,若未提取出行为则进入步骤
S12
;其中,行业专用大模型为基于优选的模型基座并使用行业专有的任务设计和相关数据集进行微调和强化学习得到的大语言模型,模型基座为可切换的;
S3、
识别提取出的行为,从行为模版库中匹配出该提取出的行为对应的行为模版作为目标行为模版,一个提取出的行为匹配一个行为模版;针对每个目标行为模版:
S4、
判断该案件的行为图谱库中是否已存在该目标行为模版对应的行为图谱,若是则将已存在的该目标行为模版对应的行为图谱作为目标行为图谱,若否则基于目标行为模版创建行为图谱作为目标行为图谱;
S5、
分析该目标行为模版中各个节点,以获得核心节点集合,核心节点集合中包括多个核心节点;
S6、
基于核心节点集合中的每个核心节点,依据该目标行为模版和对应的预定义的行为图谱创建方法,基于待处理案卷材料新建每个核心节点对应的实体提取子任务,调用行业专用大模型,基于实体提取子任务提取出对应的核心节点的核心节点实体内容;
S7、
将提取出的核心节点实体内容填充至目标行为图谱中对应的核心节点处;
S8、
基于待处理案卷材料新建含有核心节点的待补全三元组对应的补全三元组提取子任务,调用行业专用大模型,基于补全三元组提取子任务提取出对应的实体内容补全对应的补全三元组以形成完整的三元组;
S9、
判断目标行为图谱中是否有可延伸未填充三元组,若是则进入步骤
S10
,若否则进入步骤
S11
;
S10、
生成延伸补全三元组提取子任务,调用行业专用大模型,基于延伸补全三元组提取子任务提取出对应的实体补全对应的可延伸未填充三元组以形成完整的三元组,进入步骤
S11
;
S11、
行为图谱创建生成,流程结束;
S12、
结束流程
。2.
如权利要求1所述的行为图谱创建生成方法,其特征在于,所述行为图谱创建生成方法还包括:在步骤
S10
和
S11
之间包括以下步骤:
SL、
判断是否满足目标行为图谱中所有三元组均已经覆盖或目标行为图谱中三元组虽未能覆盖但已经无法从该待处理案卷材料中提取更多信息的终止条件,若是则进入步骤
S11
,若否则进入步骤
SM
;
SM、
生成未覆盖三元组提取子任务,调用行业专用大模型,基于未覆盖三元组提取子任务提取出对应的实体内容来自检未覆盖三元组,进入步骤
SL
;在步骤
SM
中,在自检操作中,先针对每一个未覆盖三元组即第一实体
—
关系
—
第二实体,提取出第二实体内容后,自动再反向提取一次第二实体
—
关系
—
第一实体
’
,利用行业专用大模型判断第一实体内容
’
和第一实体内容是否一致,在第一实体内容
’
和第一实体内
容一致时则表明没有自检冲突,提取出的第二实体内容无需填充,在第一实体内容
’
和第一实体内容不一致时则表明出现自检冲突,将提取出的第二实体内容填充至未覆盖三元组中并发出一自检冲突处理任务传给上层应用以待人工处理
。3.
如权利要求1所述的行为图谱创建生成方法,其特征在于,在步骤
S8
中,在补全操作中,先针对每一个待补全三元组即第一实体
—
关系
—
待补全第二实体,提取出第二实体内容后,自动再反向提取一次第二实体
—
关系
—
第一实体
’
,利用行业专用大模型判断第一实体内容
’
和第一实体内容是否一致,在第一实体内容
’
和第一实体内容一致时则表明没有自检冲突,再判断第二实体是否在其它三元组中被已填充实体内容,若否则将提取出的第二实体内容填充至该待补全三元组中以形成一个完整的三元组,若是则判断提取出的第二实体内容与第二实体已填充实体内容是否一致,在一致时则表明没有重叠冲突,提取出的第二实体内容无需填充,在不一致时则表明出现重叠冲突,将提取出的第二实体内容填充至该待补全三元组中并生成一重叠冲突处理任务传给上层应用以待人工处理;在第一实体内容
’
和第一实体内容不一致时则表明出现自检冲突,将提取出的第二实体内容填充至该待补全三元组中并发出一自检冲突处理任务传给上层应用以待人工处理;在步骤
S10
中,在补全操作中,先针对每一个延伸补全三元组即第一实体
—
关系
—
待补全第二实体,提取出第二实体内容后,自动再反向提取一次第二实体
—
关系
—
第一实体
’
,利用行业专用大模型判断第一实体内容
’
和第一实体内容是否一致,在第一实体内容
’
和第一实体内容一致时则表明没有自检冲突,再判断第二实体是否在其它三元组中被已填充实体内容,若否则将提取出的第二实体内容填充至该待补全三元组中以形成一个完整的三元组,若是则判断提取出的第二实体内容与第二实体已填充实体内容是否一致,在一致时则表明没有重叠冲突,提取出的第二实体内容无需填充,在不一致时则表明出现重叠冲突,将提取出的第二实体内容填充至该待补全三元组中并生成一重叠冲突处理任务传给上层应用以待人工处理;在第一实体内容
’
和第一实体内容不一致时则表明出现自检冲突,将提取出的第二实体内容填充至该待补全三元组中并发出一自检冲突处理任务传给上层应用以待人工处理
。4.
如权利要求1所述的行为图谱创建生成方法,其特征在于,在步骤
S1
中,判断该待处理案卷材料在案件的案件存储库中是否存在同类的案卷材料,若存在则为该待处理案卷材料赋予一个新的版本号,该待处理案卷材料以同类的案卷材料编号
+
新的版本号存储至案件存储库中,若不存在则为该待处理案卷材料赋予一个新的编号
+
默认初始版本号存储至案件存储库中
。5.
如权利要求1所述的行为图谱创建生成方法,其特征在于,在步骤
S5
中,计算该目标行为模版中各个节点的重要性得分,节点的重要性得分由该节点的度即该节点与其他节点的连接数来确定,将重要性得分最高的节点作为核心节点添加至核心节点集合中,其后进行迭代,在每一次迭代时选择与核心节点相邻但未被选择作为核心节点的节点,计算选择出的节点中各个节点的重要性得分,将重要性得分最高的节点作为核心节点添加至核心节点集合中,迭代终止条件为核心节点集合中核心节点数量达到设定数量,或核心节点集合中核心节点及其延伸的一层或两层实现的节点覆盖率达到设定覆盖...
【专利技术属性】
技术研发人员:刘臻,李杨峰,
申请(专利权)人:上海歆广数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。