基于文档知识库和知识图谱的检索增强生成方法技术

技术编号:46618504 阅读:2 留言:0更新日期:2025-10-14 21:14
本发明专利技术提供了一种基于文档知识库和知识图谱的检索增强生成方法,可以应用于人工智能技术领域。该方法包括:响应于接收到目标问题文本,利用先验全局知识图谱和先验文档知识图谱确定针对目标问题文本的增强数据;将目标问题文本和增强数据输入至预训练的语言模型中,生成与目标问题文本对应的目标答复文本,其中,先验全局知识图谱和先验文档知识图谱是采用如下操作得到的:根据先验知识点图谱,对基于M个文档构建的M个单文档知识图谱进行对齐,得到先验全局知识图谱;基于先验全局知识图谱构建表征M个文档间关联关系的文档知识图谱;根据先验知识点图谱,对文档知识图谱进行对齐,得到先验文档知识图谱。

【技术实现步骤摘要】

本专利技术涉及人工智能,更具体地涉及一种基于文档知识库和知识图谱的检索增强生成方法


技术介绍

1、检索增强生成是一种大语言模型的应用框架,它将传统信息检索系统的优势与生成式大语言模型的功能结合在一起,通过将外部知识库检索到的知识注入大模型,可以有效的缓解大模型生成内容的幻觉问题和事实性错误问题。

2、现有的大语言模型采用的检索增强方法仅是对文档中知识信息的重组,但这种知识组织形式忽视了文档之间的关系,从而导致大语言模型生成的答复文本回答较为片面且准确性不高。


技术实现思路

1、鉴于上述问题,本专利技术提供了基于文档知识库和知识图谱的检索增强生成方法。

2、根据本专利技术的第一个方面,提供了一种基于文档知识库和知识图谱的检索增强生成方法,上述文档知识库包括m个文档,m为大于1的整数,包括:响应于接收到目标问题文本,利用先验全局知识图谱和先验文档知识图谱确定针对上述目标问题文本的增强数据;将上述目标问题文本和上述增强数据输入至预训练的语言模型中,生成与上述目标问题文本对应的目标答复文本,本文档来自技高网...

【技术保护点】

1.一种基于文档知识库和知识图谱的检索增强生成方法,其特征在于,所述文档知识库包括M个文档,M为大于1的整数,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述先验全局知识图谱构建表征所述M个文档间关联关系的文档知识图谱,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述知识点实体节点的社区划分结果、所述M个文档的社区划分结果,更新所述文档知识图谱,得到更新后的文档知识图谱,包括:

5.根据权利要求1所述的方法,其特征在于,所述文档包括文本数据,所述...

【技术特征摘要】

1.一种基于文档知识库和知识图谱的检索增强生成方法,其特征在于,所述文档知识库包括m个文档,m为大于1的整数,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述先验全局知识图谱构建表征所述m个文档间关联关系的文档知识图谱,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述知识点实体节点的社区划分结果、所述m个文档的社区划分结果,更新所述文档知识图谱,得到更新后的文档知识图谱,包括:

5.根据权利要求1所述的方法,其特征在于,所述文档包括文本数据,...

【专利技术属性】
技术研发人员:李学伟李峰郭子瑜邵礼旭马玉辉王菁华李泽强
申请(专利权)人:齐鲁空天信息研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1