用于中医药知识问答大语言模型数据库的检索增强系统技术方案

技术编号:42864267 阅读:66 留言:0更新日期:2024-09-27 17:27
本发明专利技术公开了一种用于中医药知识问答大语言模型数据库的检索增强系统,在关键词生成器中先使用提示词工程方法构建提示词,然后采用大语言模型作为生成器获得检索关键词;在增强检索模块中采用自适应BM25算法的数据挖掘检索到中医药知识片段,最终由大语言模型OpenAI’s GPT‑3.5输出问题答案。针对目前大语言模型在中医药知识问答领域研究工作少,并且模型结果出错率高的问题,本发明专利技术方法能实现用户在基于大语言模型的中医药数据库与中医药知识问答模型协作的中医药知识问答中,获得更准确的中医学知识,提高输出结果准确性,以解决大语言模型对中医知识输出结果不合理的技术问题。

【技术实现步骤摘要】

本专利技术涉及中医药知识问答检索,更特别地说,是指一种用于中医药知识问答大语言模型数据库的检索增强系统。本专利技术方法采用问题关键词提取与自适应bm25增强检索的组合服务于中医药知识问答。


技术介绍

1、大语言模型在包括医学领域在内的各个领域都表现出了非凡的理解和生成自然语言的能力。基于大语言模型的中医药数据库(或者med-mix-2m,)在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。鉴于大语言模型具有强大的总结、逻辑理解和推理能力,是实现中医药知识问答自动生成、辅助判断、减轻医生工作量的理想工具。比如在推理和记忆方面,chatgpt在nbme-free-setp1这个数据集上达到了最佳的结果64.4%,相当于大学三年级学生的水平。而另一项微软的研究显示,在gpt4上对医学问题的回答效果更佳,基本达到80%以上的正确率。但大语言模型如chatgpt在回答时很容易出现幻觉现象,提供出错误的结果。因此在医学领域中,要求模型输出结果的精准度更高,传统的中医药大语言模型无法直接应用于医学知识回答。

>2、中医是医学知识本文档来自技高网...

【技术保护点】

1.一种用于中医药知识问答大语言模型数据库的检索增强系统,是在基于大语言模型的中医药数据库与中医药知识问答模型之间设有了中医药知识问答增强检索系统;其特征在于:中医药知识问答增强检索系统包括有关键词生成器、增强检索模块和基于LLM的知识问答交互模块;

2.根据权利要求1所述的用于中医药知识问答大语言模型数据库的检索增强系统,其特征在于:在关键词生成器中应用Few-Shot Prompting方法是将提示词按照问题类型MPR区分单项选择题PROMPT单项、多项选择题PROMPT多项和判断正误题PROMPT判断。

3.根据权利要求1所述的用于中医药知识问答大语言模型数...

【技术特征摘要】

1.一种用于中医药知识问答大语言模型数据库的检索增强系统,是在基于大语言模型的中医药数据库与中医药知识问答模型之间设有了中医药知识问答增强检索系统;其特征在于:中医药知识问答增强检索系统包括有关键词生成器、增强检索模块和基于llm的知识问答交互模块;

2.根据权利要求1所述的用于中医药知识问答大语言模型数据库的检索增强系统,其特征在于:在关键词生成器中应用few-shot prompting方法是将提示词按照问题类型mpr区分单项选择题prompt单项、多项选择题prompt多项和判断正误题prompt判断。

3.根据权利要求1所述的用于中医药知识问答大语言模型数据库的检索增强系统,其特征在于:关键词生成的输入为基于python内置函...

【专利技术属性】
技术研发人员:李易真栾钟治齐家兴黄绍晗
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1