基于图嵌入的医学领域检索增强方法、问答系统及设备技术方案

技术编号:44973455 阅读:25 留言:0更新日期:2025-04-12 01:48
本发明专利技术公开了一种基于图嵌入的医学领域检索增强方法、问答系统及设备,包括收集医学领域的问答对数据集,将问答对数据集中的问题和用户查询的问题合并建立问题集;通过大语言模型LLM对问题集中的句子进行分类,并判断其对应科室的类别;对同一类别中的问题,通过UIE模型抽取其中的医学实体,并构建问题图谱;基于所获取的问题图谱,通过随机游走和Word2Vec算法获取序列中各个节点的图嵌入作为节点的向量表示,并存入到向量数据库中;从向量数据库中检索出最为相似的N个问题,并构建检索提示;在获取检索提示后,生成器将检索提示来生成最终答案。该方法增强了模型对用户问题的理解和推理能力,更好地支持医学领域的精准信息检索和知识增强生成。

【技术实现步骤摘要】

本专利技术属于人工智能的自然语言处理领域,具体涉及一种基于图嵌入的医学领域检索增强方法、问答系统及设备


技术介绍

1、随着公众健康意识的不断增强,其对医学知识的需求也不断增加。医学知识在慢病管理、康复治疗及个性化健康指导中的重要性日益突显。尤其对于诸如心血管疾病、糖尿病和慢性阻塞性肺疾病等与精准医学密切相关的慢性病而言,科学、及时和个性化的医疗干预对于缓解疾病的发展尤为重要。然而,当今社会依然存在医疗资源分布不平衡、医疗水平参差不齐的现象,难以使居民及时获取科学、权威的医学知识。2023年前后,生成式大语言模型(large language model,llm)迅速发展,依托llm在预训练阶段习得的先验知识,能够与用户进行任意领域的对话。因此,人们也开始尝试使用llm获取医学相关知识。

2、但是,考虑到llm大多基于通用域语料进行预训练,其蕴含的先验知识可能存在“泛而不精”的问题。因此,对于具体领域的任务,往往需要该领域的相关语料对llm进行“微调”。但是,llm动辄百亿的参数使得“微调”需要较高的计算资源,这对于大部分个人开发者和中小企业来本文档来自技高网...

【技术保护点】

1.一种基于图嵌入的医学领域检索增强方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于图嵌入的医学领域检索增强方法,其特征在于,所述步骤S100具体的步骤为:

3.根据权利要求1所述的基于图嵌入的医学领域检索增强方法,其特征在于,步骤S200中所述科室包括内科、外科、妇科和儿科。

4.根据权利要求1所述的基于图嵌入的医学领域检索增强方法,其特征在于,所述步骤S300中,通过UIE模型提取出每个设定类别的问题所包含的医学实体作为关键词,并使用关键词构建图数据;

5.根据权利要求1所述的基于图嵌入的医学领域检索增强方法,其特征在于,...

【技术特征摘要】

1.一种基于图嵌入的医学领域检索增强方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于图嵌入的医学领域检索增强方法,其特征在于,所述步骤s100具体的步骤为:

3.根据权利要求1所述的基于图嵌入的医学领域检索增强方法,其特征在于,步骤s200中所述科室包括内科、外科、妇科和儿科。

4.根据权利要求1所述的基于图嵌入的医学领域检索增强方法,其特征在于,所述步骤s300中,通过uie模型提取出每个设定类别的问题所包含的医学实体作为关键词,并使用关键词构建图数据;

5.根据权利要求1所述的基于图嵌入的医学领域检索增强方法,其特征在于,所述步骤s400中的随机游走方法通过m个游走对象walker...

【专利技术属性】
技术研发人员:王煜张为民吴梦飞王志远朱静杨玉洁王远
申请(专利权)人:安徽宏元聚康医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1