一种个案图谱架构系统技术方案

技术编号:39651351 阅读:7 留言:0更新日期:2023-12-09 11:19
本发明专利技术个案图谱架构系统包括通用模版模块

【技术实现步骤摘要】
一种个案图谱架构系统


[0001]本专利技术涉及知识图谱
,特别是涉及一种个案图谱架构系统


技术介绍

[0002]知识图谱是一项相对常见的技术,当前,这项技术最常见的方案是依靠三元组架构,通过工具或人工辅助的方式,对知识图谱进行构架

这种方式由于无法摆脱人工辅助,因此图谱的创建成本高昂,导致无法以每个个案为单位创建图谱

[0003]有一种相对进一步的方式,就是直接依靠大模型对文档数据进行抽取,构建个案的图谱

如果所依托的大模型足够强
(
例如使用
ChatGPT)
,这种方式有可能抽取出足够的数据,用来构建个案的图谱

但以下问题导致这种方式很难在实战中应用:
[0004]1)
个案知识图谱应该具备相同的结构:为了确保在后续应用中,能对同一类型个案进行检索

比较

汇总,就需要个案的知识图谱具备相同的结构

但完全依托大模型自动抽取的知识图谱不具有这样的结构稳定性

每一个案件抽取出来的结构,甚至对同一个案卷材料的每一次抽取,都会产生不同的结构,这就导致不同案件之间无法对比,其应用价值大大削弱

[0005]2)
个案知识图谱应支持多个案卷材料的融合:无论医疗

法律

还是商业,每个个案都是由很多案卷材料综合支撑起来的

因此,构建知识图谱不能仅依赖一个材料,而需要从个案所有的卷宗材料中抽取完整的信息,共同构建起个案的知识图谱

如果仅依靠大模型自动抽取,由于其抽取结构的不稳定性,来自不同材料的信息无法在一个图谱中融合,因此无法使用

[0006]3)
个案知识图谱应支持同一个实体的不同版本:在实际的工作中,会经常发现个案的卷宗材料之间有很多矛盾之处,甚至同一个材料内也会存在自相矛盾的地方,很多时候,工作的突破口往往是从这些矛盾点切入的

而仅仅依靠大模型的自动抽取,无法做到准确识别两个相互矛盾的说法实际上是描述同一个实体的,由此构建的个案图谱就难以投入实用

[0007]4)
个案知识图谱应支持动态更新:由于个案在工作过程中会不断地生成新的材料,这些材料需要不断地被动态更新到个案图谱中,这样才能保障个案图谱对整个工作的不间断支撑,而不仅是事后的归档


技术实现思路

[0008]本专利技术针对现有技术存在的问题和不足,提供一种个案图谱架构系统

[0009]本专利技术是通过下述技术方案来解决上述技术问题的:
[0010]本专利技术提供一种个案图谱架构系统,其特点在于,其包括通用模版模块

行为模版模块

行为图谱模块

案由模版模块和个案图谱模块;
[0011]所述通用模版模块包括实体和关系类型管理子模块

行为模版类型管理子模块和案由模版类型管理子模块;
[0012]所述实体和关系类型管理子模块用于对特定行业中各个实体类型和关系类型进行定义和管理,并记录各个实体类型和关系类型被调用情况;
[0013]所述行为模版类型管理子模块用于按照特定行业中行为的共性划分不同行为类型,调用定义出的特定行业中各个实体类型和关系类型,为不同行为类型搭建以由实体类型

关系类型

实体类型组成的三元组为构成要素的行为模版类型,该些行为模版类型被用于搭建同类型但有差异的同一共性的不同行为模版,该些行为模版类型为可编辑的

可调用的,并记录该些行为模版类型被调用情况;
[0014]所述案由模版类型管理子模块用于按照特定行业中案由的共性划分不同案由类型,调用定义出的特定行业中各个实体类型和关系类型,为不同案由类型搭建以由实体类型

关系类型

实体类型组成的三元组为构成要素的案由模版类型,该些案由模版类型被用于搭建同类型想但有差异的同一共性的不同案由模版,该些案由模版类型为可编辑的

可调用的,并记录该些案由模版类型被调用的情况;
[0015]所述行为模版模块包括行为模版管理子模块和行为图谱创建方法子模块;
[0016]所述行为模版管理子模块用于针对特定行业中特定业务行为,为特定业务行为调用与特定业务行为同类型的行为模版类型来搭建以三元组要素为核心

且三元组之间利用同样的实体类型对接的行为模版,该些行为模版被用于牵引行为图谱创建方法子模块,为每一个个案,从待信息抽取案卷材料中抽取信息以搭建和完善行为图谱,该些行为模版为可编辑的

可调用的;
[0017]所述行为图谱创建方法子模块包括实体提取方法

三元组填空方法

实体验证及辨析方法

及文档交叉校验方法;
[0018]所述行为图谱模块包括行为图谱创建编辑子模块,所述行为图谱创建编辑子模块用于获取待信息抽取案卷材料所属的行为模版,依据所属的行为模版和行为图谱创建方法,调用行业专用大模型,基于待信息抽取案卷材料创建一系列行为图谱创建任务,通过执行一系列行为图谱创建任务,从待信息抽取案卷材料中提取三元组信息对所属的行为模版进行数据实体填充,从而生成待信息抽取案卷材料对应的行为图谱,行为图谱创建任务包括实体提取任务

三元组填空任务

实体验证辨析任务和材料交叉校验任务;
[0019]所述案由模版模块包括案由模版管理子模块和个案图谱创建方法子模块;
[0020]所述案由模版管理子模块用于针对特定行业中特定案由,为特定案由调用与特定案由同类型的案由模版类型来搭建以三元组要素为核心

且三元组之间利用同样的实体类型对接的案由模版,该些案由模版被用于牵引个案图谱创建方法子模块,为每一个个案,从行为图谱中抽取信息以搭建和完善个案图谱,该些案由模版为可编辑的

可调用的;
[0021]所述个案图谱创建方法子模块包括要件行为匹配方法

行为图谱转换方法

实体提取方法

实体验证辨析方法

及案由交叉引用方法;
[0022]所述个案图谱模块包括个案图谱创建编辑子模块,所述个案图谱创建编辑子模块用于获取行为图谱所属的个案模版,依据所属的个案模版和个案图谱创建方法,调用行业专用大模型,基于行为图谱创建一系列个案图谱创建任务,通过执行一系列个案图谱创建任务,从行为图谱中提取三元组信息对所属的个案模版进行数据实体填充,从而生成对应的个案图谱,个案图谱创建任务包括要件文档匹配任务

行为图谱转换任务
、<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种个案图谱架构系统,其特征在于,其包括通用模版模块

行为模版模块

行为图谱模块

案由模版模块和个案图谱模块;所述通用模版模块包括实体和关系类型管理子模块

行为模版类型管理子模块和案由模版类型管理子模块;所述实体和关系类型管理子模块用于对特定行业中各个实体类型和关系类型进行定义和管理,并记录各个实体类型和关系类型被调用情况;所述行为模版类型管理子模块用于按照特定行业中行为的共性划分不同行为类型,调用定义出的特定行业中各个实体类型和关系类型,为不同行为类型搭建以由实体类型

关系类型

实体类型组成的三元组为构成要素的行为模版类型,该些行为模版类型被用于搭建同类型但有差异的同一共性的不同行为模版,该些行为模版类型为可编辑的

可调用的,并记录该些行为模版类型被调用情况;所述案由模版类型管理子模块用于按照特定行业中案由的共性划分不同案由类型,调用定义出的特定行业中各个实体类型和关系类型,为不同案由类型搭建以由实体类型

关系类型

实体类型组成的三元组为构成要素的案由模版类型,该些案由模版类型被用于搭建同类型想但有差异的同一共性的不同案由模版,该些案由模版类型为可编辑的

可调用的,并记录该些案由模版类型被调用的情况;所述行为模版模块包括行为模版管理子模块和行为图谱创建方法子模块;所述行为模版管理子模块用于针对特定行业中特定业务行为,为特定业务行为调用与特定业务行为同类型的行为模版类型来搭建以三元组要素为核心

且三元组之间利用同样的实体类型对接的行为模版,该些行为模版被用于牵引行为图谱创建方法子模块,为每一个个案,从待信息抽取案卷材料中抽取信息以搭建和完善行为图谱,该些行为模版为可编辑的

可调用的;所述行为图谱创建方法子模块包括实体提取方法

三元组填空方法

实体验证及辨析方法

及文档交叉校验方法;所述行为图谱模块包括行为图谱创建编辑子模块,所述行为图谱创建编辑子模块用于获取待信息抽取案卷材料所属的行为模版,依据所属的行为模版和行为图谱创建方法,调用行业专用大模型,基于待信息抽取案卷材料创建一系列行为图谱创建任务,通过执行一系列行为图谱创建任务,从待信息抽取案卷材料中提取三元组信息对所属的行为模版进行数据实体填充,从而生成待信息抽取案卷材料对应的行为图谱,行为图谱创建任务包括实体提取任务

三元组填空任务

实体验证辨析任务和材料交叉校验任务;所述案由模版模块包括案由模版管理子模块和个案图谱创建方法子模块;所述案由模版管理子模块用于针对特定行业中特定案由,为特定案由调用与特定案由同类型的案由模版类型来搭建以三元组要素为核心

且三元组之间利用同样的实体类型对接的案由模版,该些案由模版被用于牵引个案图谱创建方法子模块,为每一个个案,从行为图谱中抽取信息以搭建和完善个案图谱,该些案由模版为可编辑的

可调用的;所述个案图谱创建方法子模块包括要件行为匹配方法

行为图谱转换方法

实体提取方法

实体验证辨析方法

及案由交叉引用方法;所述个案图谱模块包括个案图谱创建编辑子模块,所述个案图谱创建编辑子模块用于获取行为图谱所属的个案模版,依据所属的个案模版和个案图谱创建方法,调用行业专用
大模型,基于行为图谱创建一系列个案图谱创建任务,通过执行一系列个案图谱创建任务,从行为图谱中提取三元组信息对所属的个案模版进行数据实体填充,从而生成对应的个案图谱,个案图谱创建任务包括要件文档匹配任务

行为图谱转换任务

实体提取任务

实体验证辨析任务

及案由交叉引用任务
。2.
如权利要求1所述的个案图谱架构系统,其特征在于,所述实体和关系类型管理子模块用于记录各个实体类型被行为模版类型管理子模块调用次数及每次调用用于搭建哪一行为模版类型,记录各个关系类型被行为模版类型管理子模块调用次数及每次调用用于搭建哪一行为模版类型,记录各个实体类型被案由模版类型管理子模块调用次数及每次调用用于搭建哪一案由模版类型,记录各个关系类型被案由模版类型管理子模块调用次数及每次调用用于搭建哪一案由模版类型;所述行为模版类型管理子模块用于记录各个行为模版类型被行为模版管理子模块调用次数及每次调用用于搭建哪一行为模版;所述案由模版类型管理子模块用于记录各个案由模版类型被案由模版管理子模块调用次数及每次调用用于搭建哪一案由模版
。3.
如权利要求1所述的个案图谱架构系统,其特征在于,所述行为模版管理子模块设有行为模版

行为图谱的清单,行为模版

行为图谱的清单记录有每个行为模版被用于创建哪些行为图谱

建立了多少项行为图谱创建任务及各项行为图谱创建任务的执行情况,待信息抽取案卷材料包括文字材料

录音

照片和视频
。4.
如权利要求1所述的个案图谱架构系统,其特征在于,所述实体提取方法由两大类工具组成,第一类工具是根据行为模版的拓扑结构,自动分析能抵达行为模版的拓扑结构中所有节点的关键核心节点,以该些关键核心节点作为优先提取的实体对象的工具;第二类工具是根据行为模版中实体的类型

待信息抽取案卷材料以及用来执行提取任务的行业专用大模型的类型,自动生成提取实体提示词的工具;其中,行业专用大模型为基于优选的模型基座并使用行业专有的任务设计和相关数据集进行微调和强化学习得到的大语言模型,模型基座为可切换的;所述三元组填空方法用于根据行为模版中三元组中的已知实体

关系和关系指向的方向,待信息抽取案卷材料,以及用来执行提取任务的行业专用大模型的类型,自动生成提示词的工具集合;所述实体验证及辨析方法实行先验证再辨析操作,包括两种:第一种:在一个三元组填空完成后,自动执行一次反向提取,用新提取到的实体对同一个三元...

【专利技术属性】
技术研发人员:刘臻李杨峰
申请(专利权)人:上海歆广数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1