一种基于预训练大模型的医疗信息查询系统及方法技术方案

技术编号:39158690 阅读:8 留言:0更新日期:2023-10-23 15:01
本发明专利技术公开了一种基于预训练大模型的医疗信息查询系统及方法,属于数据处理技术领域,方法包括:S1、构建医疗数据检索场景下的ODR数据库和指令微调数据集;S2、对语言大模型进行模型微调,获得医疗信息检索模型;S3、接收医疗信息查询条件,并将其转换为标准检索指令;S4、基于标准检索指令查询调取所需医疗信息;S5、将调取的所需医疗信息进行可视化展示,实现医疗信息查询。本发明专利技术利用开源预训练语言大模型学习到的自然语言理解能力,引入医疗场景的指令微调数据集,并在不同的业务场景下通过业务系统自动填充上下文信息,向医生提供符合医生习惯的自然语言的数据检索能力,扩展了数据检索系统支撑的能力,降低了医生的使用成本。本。本。

【技术实现步骤摘要】
一种基于预训练大模型的医疗信息查询系统及方法


[0001]本专利技术属于数据处理
,具体涉及一种基于预训练大模型的医疗信息查询系统及方法。

技术介绍

[0002]当前的医疗信息系统按照不同的职能划分为较多的子系统,比如LIS系统(Laboratory Information System)用于管理患者的检验相关信息,包括实验室设备管理、检验申请和检验结果等。PACS系统(Picture Archiving and Communication System)用于管理患者的医学影像信息,包括CT、MRI、X光片等医学影像的存储、传输和诊断。EMR系统(Electronic Medical Record)是用于管理病人电子病历的信息系统,包括病人的基本信息、病史、诊断结果、医嘱等信息。
[0003]这些系统彼此独立,医护人员要查询相关的信息需要登录不同的系统,且查询的条件和展示的数字字段都比较固化,无法满足医生个性化的查询诉求,比如查询各科室过去3年治疗糖尿病患者人次和费用”,这样的统计查询条件和要展示的结果字段很难提前穷举,很多信息系统通过直接开放“自定义sql查询”功能来解决这些长尾需求,但通过sql查询对医护人员技能要求很高,一般很难使用。
[0004]总结下来,当前的医疗信息系统为医生提供的信息检索功能存在以下两个问题:1)查询的条件和结果字段提前固化,无法满足医生个性化的查询诉求。
[0005]2)综合查询或自定义查询界面非常复杂且技术门槛较高,医生学习使用成本高,查询效率低下。r/>
技术实现思路

[0006]针对现有技术中的上述不足,本专利技术提供的基于预训练大模型的医疗信息查询系统及方法解决了现有医疗信息查询方法查询条件固化、查询技术门槛高以及查询效率低下的问题。
[0007]为了达到上述专利技术目的,本专利技术采用的技术方案为:一种基于预训练大模型的医疗信息查询系统,包括:模型训练模块:用于根据医疗数据检索场景下的指令微调数据集微调语言大模型,获得医疗信息检索模型;ODR数据库:用于存储基于sql查询语句的医疗信息数据表,作为医疗信息检索模型的信息查询数据库;前端业务工作站:用于接收用户的医疗信息查询条件;信息检索模块:用于将医疗信息查询条件完善并转换为标准检索指令后输入至医疗信息检索模型中;信息查询模块:用于根据输入医疗信息检索模型中的标准检索指令生成sql查询语句,进而在ODR数据库中查询并调取所需医疗信息;
信息可视化组件:嵌入在所述前端业务工作站中,用于为用户可视化展示所需医疗信息,实现医疗信息查询。
[0008]进一步地,所述指令微调数据集中的微调指令内容包括数据表字段描述、当前上下文信息以及查询描述文本,其对应的指令动作为sql查询语句;其中,数据表字段描述为医疗信息的数据表提示词,当前上下文信息为与数据表提示词相关的数据表字段值,查询描述文本为目标查询医疗信息。
[0009]进一步地,所述ODR数据库中存储的医疗信息数据表包括患者信息表、住院记录表、医嘱记录表、检验记录表、手术排班表、手术过程记录表、生命体征记录表、手术耗材消耗表以及手术药品消耗表;每个所述数据表均有对应的若干医疗信息明细,任一医疗信息明细作为对应数据表的数据表提示词。
[0010]进一步地,所述医疗信息检索模型包括基于文本的医疗信息检索模型和基于语音的医疗信息检索模型;其中,基于文本的医疗信息检索模型对应文本格式的指令微调数据集;基于语音的医疗信息检索模型对应将语音转换为文本后的指令微调数据集。
[0011]一种医疗信息查询方法,包括以下步骤:S1、构建医疗数据检索场景下的ODR数据库和指令微调数据集;S2、利用指令微调数据集对语言大模型进行模型微调,获得医疗信息检索模型;S3、接收用户的医疗信息查询条件,并将其转换为标准检索指令;S4、基于标准检索指令查询调取所需医疗信息;S5、将调取的所需医疗信息进行可视化展示,实现医疗信息查询。
[0012]进一步地,所述步骤S1中,所述指令微调数据集用于生成实现医疗信息查询的sql查询语句;所述指令微调数据集生成的sql查询语句包括单表查询和多表关联查询;所述指令微调数据集中的微调指令内容包括数据表字段描述、当前上下文信息以及查询描述文本,其对应的指令动作为sql查询语句;其中,数据表字段描述为医疗信息的数据表提示词,当前上下文信息为与数据表提示词相关的数据表字段值,查询描述文本为目标查询医疗信息。
[0013]进一步地,所述步骤S3具体为:S31、接收的医疗信息查询条件;其中,医疗信息查询条件包括语音信息条件和文本信息条件,当为语音信息条件时,通过将其转换为对应的文本信息条件;S32、根据当前医疗场景,自动填充完善文本信息条件的上下文信息,并转换成标准检索指令;其中,标准检索指令为数据表字段描述+当前上下文信息+查询描述文本。
[0014]进一步地,所述步骤S4具体为:S41、根据标准检索指令,利用医疗信息检索模型输出对应的sql查询语句;S42、根据sql查询语句在ODR数据库中调取所需医疗信息。
[0015]进一步地,所述步骤S5具体为:
S51、根据调取所需医疗信息的数据格式,进行数据渲染;S52、将数据渲染后的医疗信息以通用页面展示在各前端业务工作站的各业务场景中,实现医疗信息查询。
[0016]本专利技术的有益效果为:本专利技术利用开源预训练语言大模型学习到的自然语言理解能力,词语与词语之间的语义关系基础上引入医疗场景的指令微调数据集,并在不同的业务场景下通过业务系统自动填充上下文信息,可向医生提供符合医生习惯的自然语言的数据检索能力,大大扩展了数据检索系统支撑的能力,同时大大降低了医生的使用成本。
附图说明
[0017]图1为本专利技术提供的基于预训练大模型的医疗信息查询方法流程图。
具体实施方式
[0018]下面对本专利技术的具体实施方式进行描述,以便于本
的技术人员理解本专利技术,但应该清楚,本专利技术不限于具体实施方式的范围,对本
的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本专利技术的精神和范围内,这些变化是显而易见的,一切利用本专利技术构思的专利技术创造均在保护之列。
[0019]实施例1:本专利技术实施例提供了一种基于预训练大模型的医疗信息查询系统,包括:模型训练模块:用于根据医疗数据检索场景下的指令微调数据集微调语言大模型,获得医疗信息检索模型;ODR数据库:用于存储基于sql查询语句的医疗信息数据表,作为医疗信息检索模型的信息查询数据库;前端业务工作站:用于接收用户的医疗信息查询条件;信息检索模块:用于将医疗信息查询条件完善并转换为标准检索指令后输入至医疗信息检索模型中;信息查询模块:用于根据输入医疗信息检索模型中的标准检索指令生成sql查询语句,进而在ODR数据库中查询并调取所需医疗信息;信息可视化组件:嵌入在所述前端业务工作站中,用于为用户可视化展示所需医疗信息,实现医疗信息查询。
[0020]在本专利技术实施例中,当前已有很多开本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于预训练大模型的医疗信息查询系统,其特征在于,包括:模型训练模块:用于根据医疗数据检索场景下的指令微调数据集微调语言大模型,获得医疗信息检索模型;ODR数据库:用于存储基于sql查询语句的医疗信息数据表,作为医疗信息检索模型的信息查询数据库;前端业务工作站:用于接收用户的医疗信息查询条件;信息检索模块:用于将医疗信息查询条件完善并转换为标准检索指令后输入至医疗信息检索模型中;信息查询模块:用于根据输入医疗信息检索模型中的标准检索指令生成sql查询语句,进而在ODR数据库中查询并调取所需医疗信息;信息可视化组件:嵌入在所述前端业务工作站中,用于为用户可视化展示所需医疗信息,实现医疗信息查询。2.根据权利要求1所述的基于预训练大模型的医疗信息查询系统,其特征在于,所述指令微调数据集中的微调指令内容包括数据表字段描述、当前上下文信息以及查询描述文本,其对应的指令动作为sql查询语句;其中,数据表字段描述为医疗信息的数据表提示词,当前上下文信息为与数据表提示词相关的数据表字段值,查询描述文本为目标查询医疗信息。3.根据权利要求1所述的基于预训练大模型的医疗信息查询系统,其特征在于,所述ODR数据库中存储的医疗信息数据表包括患者信息表、住院记录表、医嘱记录表、检验记录表、手术排班表、手术过程记录表、生命体征记录表、手术耗材消耗表以及手术药品消耗表;每个所述数据表均有对应的若干医疗信息明细,任一医疗信息明细作为对应数据表的数据表提示词。4.根据权利要求1所述的基于预训练大模型的医疗信息查询系统,其特征在于,所述医疗信息检索模型包括基于文本的医疗信息检索模型和基于语音的医疗信息检索模型;其中,基于文本的医疗信息检索模型对应文本格式的指令微调数据集;基于语音的医疗信息检索模型对应将语音转换为文本后的指令微调数据集。5.根据权利要求1~4任一项所述的基于预训练大模型的医疗信息查询系统的医...

【专利技术属性】
技术研发人员:汪小东张晓宇石丹杰杨洲
申请(专利权)人:浙江瑞华康源科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1