基于问卷和大模型的医学队列随访对话辅助方法及系统技术方案

技术编号:38905147 阅读:16 留言:0更新日期:2023-09-22 14:23
本发明专利技术公布了一种基于问卷和大模型的医学队列随访对话辅助方法及系统,包括:医学知识图谱模块、大语言模型模块、逻辑控制模块;构建医学知识图谱,并在其上实现智能问答;设计由系统引导的“分诊

【技术实现步骤摘要】
基于问卷和大模型的医学队列随访对话辅助方法及系统


[0001]本专利技术属于人工智能医学对话系统
,涉及大语言模型和量表问诊技术,具体涉及一种基于问卷模板和大语音模型的医学队列随访轻量级文本对话辅助方法及系统。

技术介绍

[0002]随着现代社会人们对于医疗健康的关注度越来越高,去医院挂号问诊的现象越来越常见。传统的问诊过程存在科室选择难、排队时间长、问诊效率低、数据处理困难等问题。因此,需要设计并开发一款既能够方便患者进行初步自我筛查,又能够辅助医生进行临床诊断的智能医学对话辅助系统。
[0003]对话系统按照实现技术可以分为两类:管道式对话系统和端到端式对话系统。管道式对话系统一般由多个组件或模块组成,每个组件或模块都有自己的输入和输出,负责一个特定的任务,模块之间通过接口进行通信。管道式的架构可能导致“错误累积”,即前面模块引入的错误会由于向后传递而一直累积,导致系统整体表现不佳。而端到端式对话系统则是指由单个模块构成的一个完整系统,它不需要多个模块来处理不同的任务,而是可以通过深度学习模型直接将用户输入映射到输出。这种架构不仅可以减少错误传递,还具有更高的灵活性和泛化能力,以及一定的上下文感知能力。医学领域的智能对话系统服务例如Microsoft的Healthcare Bot, AdaHealth的Ada等,它们可以通过分析处理相关医疗数据、医学临床文献和患者的电子病历等信息,从而辅助医生进行诊断并制定治疗方案。
[0004]现有的医学对话辅助系统大多基于知识图谱技术或自然语言处理技术之一。其中:基于知识图谱技术的医学对话辅助系统虽具有更系统专业的医学知识库和更有逻辑的推理判断能力,但大多缺乏良好的问题理解能力以及与用户交互的灵活性和友好性;基于自然语言处理技术的医学对话辅助系统虽具有更好的问题理解和语言生成能力,但大多缺乏医学领域知识的专业性和诊断的准确性。此外,目前大多数医学对话辅助系统均以用户的提问或查询为主导,缺乏一定的系统引导,同时也缺乏临床量表的设计规范性。

技术实现思路

[0005]为了克服上述现有技术的不足,本专利技术提供了一种基于问卷和大模型的医学队列随访对话辅助方法及系统,以知识图谱为基础,以量表问诊为主线,以大语言模型为核心的智能医学对话辅助系统,有效地利用知识图谱技术、自然语言处理技术、临床量表问诊,实现智能医学对话辅助。
[0006]本专利技术首先构建一个医学知识图谱,并在其上实现智能问答;然后设计一套由系统引导的“分诊

预问诊

聊天”的三阶段工作流程算法,接着构建微调语料集并微调大语言模型(采用ChatGLM

6B),最后进行系统设计,结合知识图谱、大模型和问卷模板,最终形成一个完整的轻量级医学对话辅助系统。
[0007]本专利技术能够根据用户的提问自动匹配最佳的量表问卷,然后由系统引导进行规范
化的预问诊,最后进行表达多样化的交互式对话聊天。具备聊天记录保存、知识图谱检索、图片上传、病历存储分析、疾病预判等功能。具有分诊准确率高、预问诊流程规范、聊天交互友好、响应速度快、稳定性好等优势。
[0008]本专利技术实现的基于问卷和大模型的医学队列随访对话辅助系统主要包括三个模块:医学知识图谱模块、大语言模型模块、逻辑控制模块。其中以大语言模型模块为核心,通过与其的交互实现各个功能。以逻辑控制模块为主线,设计算法控制系统整体的工作流程逻辑和边界判断管理。以医学知识图谱模块作为系统的专业知识支撑,既能从中抽取知识构成大模型微调训练语料集的一部分,又能利用其在实现系统的交互聊天功能时首先为大模型提供提示。
[0009]本专利技术提供的一种基于问卷和大模型的医学队列随访对话辅助方法,包括如下步骤:1)收集医学知识三元组数据,使用图数据库(如Neo4j),构建医学知识图谱;医学知识图谱还作为系统的专业知识支撑,在实现交互聊天时首先通过其上的问答为大模型提供提示;2)采用基于模板的语义解析方法实现医学知识图谱上的智能问答,并安装图数据科学插件,然后基于图算法(PageRank)计算疾病节点并发症关系排名;3)构建语料集,包括:医学分诊数据集、各科室问卷数据集、医学问答数据集、医学知识数据集和通用语料集等多种数据;其中医学知识数据集是通过医学知识图谱中的三元组生成的问答形式的数据集;4)选定大语言模型;以多种数据集对大语言模型进行微调,通过逻辑控制,分别实现分诊导诊、量表生成、交互聊天、病历存储、疾病预判;5)设计“分诊

预问诊

聊天”三阶段工作流程算法及边界管理策略,主要过程如下:a. 第一阶段为分诊阶段;通过逻辑控制,将用户的提问与类别进行映射,确定分诊结果;通过网页端后进入系统引导,引导用户输入想要咨询的内容。然后逻辑控制模块将调用分诊导诊功能,把用户的提问映射到既定的32个类别,其中包括31个科室与1个无法判断。若结果为无法判断,则提示用户重新输入咨询内容,否则将判断结果呈现给用户,由用户评估分诊结果是否合理。若用户回答不合理,则重新调用分诊导诊功能,给出新的结果。若用户回答合理,则进入下一阶段。
[0010]b. 第二阶段为预问诊阶段。生成临床诊断辅助问卷,将临床诊断辅助问卷的问题逐个推送给用户;当用户回答完某一问题,自动进行问答相关性检测;再自动进行病历存储,并进行疾病预判,得到可能性最大的疾病名称;在这一阶段中,逻辑控制模块首先调用量表生成功能,生成一份确定科室下的由十一个问题组成的临床诊断辅助问卷,然后将问题逐个推送给用户。需要说明的是,在用户回答某一问题的过程中,可以自由选择重写作答上一问题,或是暂时退出预问诊阶段进入聊天阶段,而后再返回当前问题继续作答,以便于用户更好的了解问题中的相关信息。当用户回答完某一问题时,逻辑控制模块将自动调用问答相关性检测功能,若检测结果为不相干,则提示用户重写回答该问题,以此避免搜集到胡乱作答的病历。当量表问卷中的所有问
题都回答完并通过检测后,将自动进行病历存储,再由逻辑控制模块调用疾病预判功能,结合系统已搜集的信息给出最有可能的疾病名称。
[0011]c. 第三阶段为聊天阶段。将用户发送的文本内容在知识图谱中进行基于语义解析的智能问答;并确定内容输入到大模型中;为继续提高微调后的大模型生成回答的质量和准确度,在交互聊天时用户发送一段内容(原内容)后,逻辑控制模块将首先用这段文本在知识图谱中进行基于语义解析的智能问答,若能生成相关回答,则将原内容和生成的回答一并作为提示(Prompt)的一部分,以此构造出新问题,输入到大模型中。若无法生成相关回答,则直接将原内容输入到大模型中。
[0012]d. 最后,考虑到某些用户的特殊需求,系统支持在任意时刻输入指令直接进入聊天阶段,以及在任意时刻输入指令重新进入第一阶段。
[0013]与现有技术相比,本专利技术的有益效果是:利用本专利技术提供的技术方案,能够满足方便患者进行初步自我筛查,辅助医生进行临床诊断的需求,能够解决知识图谱、大语言模型、量表问诊三者本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于问卷和大模型的医学队列随访对话辅助方法,其特征是,构建医学知识图谱,并在其上实现智能问答;设计由系统引导的“分诊

预问诊

聊天”三阶段工作流程算法;构建微调语料集并微调大语言模型;设计系统,结合知识图谱、大模型和问卷模板,实现完整的轻量级医学对话辅助;包括如下步骤:1)收集医学知识三元组数据,使用图数据库构建医学知识图谱;医学知识图谱用于作为系统的专业知识支撑,在实现交互聊天时首先通过其上的问答为大模型提供提示;2)采用基于模板的语义解析方法实现医学知识图谱上的智能问答,并安装图数据科学插件,然后基于图算法计算疾病节点并发症关系排名;3)构建语料集,包括:医学分诊数据集、各科室问卷数据集、医学问答数据集、医学知识数据集和通用语料集多种数据;其中医学知识数据集是通过医学知识图谱中的三元组生成的问答形式的数据集;4)选定大语言模型;以多种数据集对大语言模型进行微调,通过逻辑控制,分别实现分诊导诊、量表生成、交互聊天、病历存储、疾病预判;5)设计“分诊

预问诊

聊天”三阶段工作流程算法及边界管理策略;主要过程如下:a. 第一阶段为分诊阶段;通过逻辑控制,将用户的提问与类别进行映射,确定分诊结果;b. 第二阶段为预问诊阶段;生成临床诊断辅助问卷,将临床诊断辅助问卷的问题逐个推送给用户;当用户回答完某一问题,自动进行问答相关性检测;再自动进行病历存储,并进行疾病预判,得到可能性最大的疾病名称;c. 第三阶段为聊天阶段;将用户发送的文本内容在知识图谱中进行基于语义解析的智能问答;并确定内容输入到大模型中;还支持在任意时刻输入指令直接进入聊天阶段,以及在任意时刻输入指令重新进入第一阶段;通过上述步骤,实现基于问卷和大模型的医学队列随访对话辅助。2.如权利要求1所述基于问卷和大模型的医学队列随访对话辅助方法,其特征是,图数据库采用Neo4j;图算法采用PageRank。3.如权利要求1所述基于问卷和大模型的医学队列随访对话辅助方法,其特征是,大语言模型采用ChatGLM

6B。4.如权利要求1所述基于问卷和大模型的医学队列随访对话辅助方法,其特征是,步骤3)中,构建用于大语言模型微调训练的语料集即微调语料集具体组成如下:a. 分诊部分:包括四组来源于网络的开源医学分诊数据集,进行科室名称标准化后,从中随机抽取共5000条用于微调训练;...

【专利技术属性】
技术研发人员:黄雨柴忠言金芝王捍贫
申请(专利权)人:北京六元空间信息科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1