System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于知识库和大语言模型的互动式知识交互系统技术方案_技高网

基于知识库和大语言模型的互动式知识交互系统技术方案

技术编号:41329037 阅读:5 留言:0更新日期:2024-05-13 15:07
本申请涉及一种基于知识库和大语言模型的互动式知识交互系统。系统包括:交互接口模块,用于接收用户输入的问答请求,问答请求中包含有待查询的医学问题的描述数据;大语言模型模块,用于通过自由式输入或引导式输入将描述数据输入语言识别模型,并获取语言识别模型输出的医学问题的分类信息;知识库模块,用于根据医学问题的分类信息,确定医学问题对应的知识库,在医学问题对应的知识库中查询医学问题对应的回答数据;对话式输出和追问模块,用于根据医学问题对应的回答数据,以及用户再次输入的医学问题,形成连续多轮对话,并对连续多轮对话进行再学习,以实现自由式问答和引导式问答。采用本方法能够提高获取的医学知识的准确度。

【技术实现步骤摘要】

本申请涉及大数据,特别是涉及一种基于知识库和大语言模型的互动式知识交互系统


技术介绍

1、随着人工智能技术的发展,人工智能技术在医疗健康领域得到越来越广泛的应用。通过人工智能技术可以提供疾病和健康相关知识和信息的咨询服务,也为医疗行业提供决策支持和服务。

2、相关技术中,通常基于大语言模型生成相关的查询模型,从而通过查询模型来实现疾病和健康相关知识和信息的查询。然而,当前的查询模型,着重于自然语言的理解和生成,可以实现机器翻译、文本摘要、情感分析、医患对话分析等功能,但对于医疗健康领域的专业知识和精细化问题的输出容易出错。同时,当前的大语言模型查询的知识库中的医学知识不够全面,知识库也可能存在错误信息,从而导致获取的医学知识的准确度不高,大语音模型自身的幻觉(hallucination)也会导致错误信息的输出。此外,随着技术的不断进步,新技术在医疗领域的应用日益增多,例如在肿瘤诊疗中广泛使用的二代测序(nextgeneration sequencing,ngs)。ngs报告的专业性要求极高,因此,大多数患者和医生通常需要依靠第三方检测机构或生物信息学专家来进行精确的解读,只有结合多学科专家团队的综合会诊,才能确保这些检测结果得到正确和全面的应用。然而,这种级别的专业知识,若无长期的实践经验和数据积累,仅仅依赖大型语言模型的反复训练,是难以保证信息输出的准确性的。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高获取的医学知识的准确度的基于知识库和大语言模型的互动式知识交互系统。

2、第一方面,本申请提供了一种基于知识库和大语言模型的互动式知识交互系统,所述系统包括:

3、交互接口模块,用于接收用户输入的问答请求,所述问答请求中包含有待查询的医学问题的描述数据;

4、大语言模型模块,用于通过自由式输入或引导式输入将所述描述数据输入语言识别模型,并获取所述语言识别模型输出的所述医学问题的分类信息;所述语言识别模型为大语言模型,所述大语言模型用于对所述医学问题进行解析和信息提取,以根据提取到的信息和上下文信息理解所述医学问题对应的意图,并基于所述医学问题的意图确定所述医学问题对应的分类信息;所述语言识别模型是以历史和不断新增的医学数据为样本训练后生成的;

5、知识库模块,用于根据所述医学问题的分类信息,确定所述医学问题对应的知识库,在所述医学问题对应的知识库中查询所述医学问题对应的回答数据,所述回答数据中包含有所述医学问题对应的医学知识数据;

6、对话式输出和追问模块,用于根据所述医学问题对应的回答数据,以及用户再次输入的医学问题,形成连续多轮对话,并对所述连续多轮对话进行再学习,以实现自由式问答和引导式问答;

7、其中,所述知识库包括第一知识库、第二知识库和第三知识库;所述第一知识库包括服务器上的本地知识库,所述本地知识库中包括预采集的各个医学领域的知识数据以及自有数据库,所述第二知识库包括预先标定的医学领域的开源知识库,所述第三知识库包括公共领域的开源知识库;

8、所述本地知识库为自建数据库,所述本地知识库中包括以下至少一项医学知识数据:治疗数据、诊断数据、预后数据、分子解读数据、案例参考数据、临床试验数据、药物数据。

9、在其中一个实施例中,所述大语言模型模块,还用于若所述医学问题对应所述第一知识库,则从所述描述数据中提取出与所述医学问题相关的实体,将所述实体作为关键词,同时识别出所述关键词之间的指代关系;根据所述实体对应的关键词及其所述关键词之间的指代关系,对描述数据中的模糊语句进行分析,生成所述医学问题的分析结果,所述分析结果用于表征所述医学问题对应的意图;根据所述分析结果,将所述医学问题的关键词,与所述第一知识库对应的数据向量进行匹配,得到匹配结果;根据所述匹配结果,在所述第一知识库中查询所述医学问题的回答数据。

10、在其中一个实施例中,所述大语言模型模块,还用于若所述匹配结果指示所述医学问题的对应的实体的关键词及所述关键词之间的指代关系匹配成功则使用匹配成功的数据向量在所述第一知识库中查询所述医学问题的回答数据;若所述匹配结果指示所述医学问题对应的实体的关键词及所述关键词之间的指代关系匹配失败,调用所述语言识别模型,在所述第三知识库中查询所述医学问题的回答数据。

11、在其中一个实施例中,所述描述数据为多模态数据,所述大语言模型模块,还用于将多模态的描述数据输入语言识别模型的特征提取单元进行特征提取,得到所述多模态的描述数据分别对应的数据特征,并对所述多模态的描述数据分别对应的数据特征进行特征融合得到融合后的特征;将所述融合后的特征输入所述语言识别模型的分类网络单元,得到并输出所述医学问题的分类信息。

12、在其中一个实施例中,所述系统还包括:

13、输出逻辑调整模块,所述输出逻辑调整模块用于运用自然语言处理和机器学习算法对回答数据进行逻辑推理,并根据逻辑推理结果、分类信息对应的回复提词信息、所述医学问题的描述数据和所述医学问题对应的场景,对所述医学问题的回答数据的表述方式进行调整。

14、在其中一个实施例中,所述大语言模型模块,还用于根据理解到的医学问题对应的意图,确定所述医学问题是否为异常提问;若所述医学问题为异常提问,则调用所述语言识别模型,在所述第三知识库中查询所述医学问题的回答数据,所述异常提问用于指示提问内容为非医学相关内容。

15、第二方面,本申请提供了一种基于知识库和大语言模型的互动式知识交互方法,所述方法包括:

16、接收用户输入的问答请求,所述问答请求中包含有待查询的医学问题的描述数据;

17、通过自由式输入或引导式输入将所述描述数据输入语言识别模型,并获取所述语言识别模型输出的所述医学问题的分类信息;所述语言识别模型为大语言模型,所述大语言模型用于对所述医学问题进行解析和信息提取,以根据提取到的信息和上下文信息理解所述医学问题对应的意图,并基于所述医学问题的意图确定所述医学问题对应的分类信息;所述语言识别模型是以历史和不断新增的医学数据为样本训练后生成的;

18、根据所述医学问题的分类信息,确定所述医学问题对应的知识库,在所述医学问题对应的知识库中查询所述医学问题对应的回答数据,所述回答数据中包含有所述医学问题对应的医学知识数据;

19、根据所述医学问题对应的回答数据,以及用户再次输入的医学问题,形成连续多轮对话,并对所述连续多轮对话进行再学习,以实现自由式问答和引导式问答;

20、其中,所述知识库包括第一知识库、第二知识库和第三知识库;所述第一知识库包括服务器上的本地知识库,所述本地知识库中包括预采集的各个医学领域的知识数据以及自有数据库,所述第二知识库包括预先标定的医学领域的开源知识库,所述第三知识库包括公共领域的开源知识库;

21、所述本地知识库为自建数据库,所述本地知识库中包括以下至少一项医学知识数据:本文档来自技高网...

【技术保护点】

1.一种基于知识库和大语言模型的互动式知识交互系统,其特征在于,所述系统包括:

2.根据权利要求1所述的系统,其特征在于,所述大语言模型模块,还用于若所述医学问题对应所述第一知识库,则从所述描述数据中提取出与所述医学问题相关的实体,将所述实体作为关键词,同时识别出所述关键词之间的指代关系;根据所述实体对应的关键词及其所述关键词之间的指代关系,对描述数据中的模糊语句进行分析,生成所述医学问题的分析结果,所述分析结果用于表征所述医学问题对应的意图;根据所述分析结果,将所述医学问题的关键词,与所述第一知识库对应的数据向量进行匹配,得到匹配结果;根据所述匹配结果,在所述第一知识库中查询所述医学问题的回答数据。

3.根据权利要求2所述的系统,其特征在于,所述大语言模型模块,还用于若所述匹配结果指示所述医学问题对应的实体的关键词及所述关键词之间的指代关系匹配成功,则使用匹配成功的数据向量在所述第一知识库中查询所述医学问题的回答数据;若所述匹配结果指示所述医学问题对应的实体的关键词及所述关键词之间的指代关系失败,调用所述语言识别模型,在所述第三知识库中查询所述医学问题的回答数据。

4.根据权利要求1-3任一项所述的系统,其特征在于,所述描述数据为多模态数据,所述大语言模型模块,还用于将多模态的描述数据输入语言识别模型的特征提取单元进行特征提取,得到所述多模态的描述数据分别对应的数据特征,并对所述多模态的描述数据分别对应的数据特征进行特征融合得到融合后的特征;将所述融合后的特征输入所述语言识别模型的分类网络单元,得到并输出所述医学问题的分类信息。

5.根据权利要求1-3任一项所述的系统,其特征在于,所述系统还包括:

6.根据权利要求5所述的系统,其特征在于,所述大语言模型模块,还用于根据理解到的医学问题对应的意图,确定所述医学问题是否为异常提问;若所述医学问题为异常提问,则调用所述语言识别模型,在所述第三知识库中查询所述医学问题的回答数据,所述异常提问用于指示提问内容为非医学相关内容。

7.一种基于知识库和大语言模型的互动式知识交互方法,其特征在于,所述方法包括:

8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求7所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求7所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求7所述的方法的步骤。

...

【技术特征摘要】

1.一种基于知识库和大语言模型的互动式知识交互系统,其特征在于,所述系统包括:

2.根据权利要求1所述的系统,其特征在于,所述大语言模型模块,还用于若所述医学问题对应所述第一知识库,则从所述描述数据中提取出与所述医学问题相关的实体,将所述实体作为关键词,同时识别出所述关键词之间的指代关系;根据所述实体对应的关键词及其所述关键词之间的指代关系,对描述数据中的模糊语句进行分析,生成所述医学问题的分析结果,所述分析结果用于表征所述医学问题对应的意图;根据所述分析结果,将所述医学问题的关键词,与所述第一知识库对应的数据向量进行匹配,得到匹配结果;根据所述匹配结果,在所述第一知识库中查询所述医学问题的回答数据。

3.根据权利要求2所述的系统,其特征在于,所述大语言模型模块,还用于若所述匹配结果指示所述医学问题对应的实体的关键词及所述关键词之间的指代关系匹配成功,则使用匹配成功的数据向量在所述第一知识库中查询所述医学问题的回答数据;若所述匹配结果指示所述医学问题对应的实体的关键词及所述关键词之间的指代关系失败,调用所述语言识别模型,在所述第三知识库中查询所述医学问题的回答数据。

4.根据权利要求1-3任一项所述的系统,其特征在于,所述描述数据为多模态数据,所述大语言模型模块,还用于将多模态的描...

【专利技术属性】
技术研发人员:王凯徐赞美庞菲陈惠陈丽娟
申请(专利权)人:至本医疗科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1