基于GPT-2模型的智能分诊与医疗问答方法及其装置制造方法及图纸

技术编号:31757873 阅读:73 留言:0更新日期:2022-01-05 16:41
本发明专利技术属于计算机技术领域,尤其涉及基于GPT

【技术实现步骤摘要】
基于GPT

2模型的智能分诊与医疗问答方法及其装置


[0001]本专利技术属于计算机
,尤其涉及基于GPT

2模型的智能分诊与医疗问答方法及其装置。

技术介绍

[0002]在我国看病难成了大众较为担忧的问题之一。在治疗以及后续治疗的过程中,医生往往能够较为高效率地接收与处理病患,而在挂号与分诊阶段,却经常出现由于病患不知道挂什么号以及分诊人员不足等原因而造成的堵塞,另外在医院较为嘈杂的环境中,病患难以与分诊人员在有限的时间内进行有效的交流,这也浪费了大量的时间。并且,患者往往在分诊时就已经产生了大量的疑惑,这些疑问被迫拖至在治疗时向医生寻求解答,导致耽误了医疗时间。国内自动分诊的分析与研究方面,已经有大量的企业与科研机构将目光投向了自动分诊系统的开发,包括:北京左医科技有限公司所开发的一系列智能导诊系统,通过采取询问患者一系列的问题的方式,从而不断缩小范围,最后得到具体的科室,已经服务于全国各大医院,缺点是耗时较长,需要进行多轮对话,百度集团开发的百度医生项目,通过图解人体结构,用户从中选择患处,从而实现分诊,主要优点是操作方便,不足之处在于病源与患处的位置并不统一,目前市场上所使用自动分诊技术大体上都近似于以上两种方法。
[0003]以上对于分诊系统的研究与开发,偏重于直接对于患者进行分诊服务,没有重视于患者疑问的初步解惑上,即没有对于患者挂号时所提及的信息,给出初步的疑惑解答。疑惑解答能够提升后续医疗服务中的效率,节省患者与医生大量的时间。所以需要一种既能够自动化对患者进行分诊,又能够智能回答患者疑惑的方法及其装置。

技术实现思路

[0004]本专利技术目的在于提供基于GPT

2模型的智能分诊与医疗问答方法及其装置,能高效地进行分诊并初步解决患者的疑惑,可以在分诊与挂号阶段节省大量的时间,以至于使整个看病就医的时间得到缩短,进而提升整个医院的服务效率。
[0005]本专利技术的1、一种基于GPT

2模型的智能分诊与医疗问答方法,其特征在于,所述方法包括:
[0006]获取GPT

2分诊网络模型及GPT

2医疗问答网络模型;
[0007]接收所述患者信息;
[0008]根据所述患者信息,利用所述GPT

2分诊网络模型及所述GPT

2医疗问答网络模型确定所述患者的分诊分类及问诊答案;
[0009]统计分析分诊分类及问诊答案。
[0010]进一步的,所述步骤1中的GPT

2分诊网络模型训练采用中文GPT

2分诊预训练模型;所述中文GPT

2分诊预训练模型的训练包括:分类训练数据标注和GPT

2分诊网络模型自动化训练;
[0011]进一步的,所述分类训练数据标注的处理包括:编码处理和去噪处理;所述GPT

2分诊网络模型自动化训练,具体步骤如下:
[0012](1)经分类训练数据标注后形成的分诊分类数据,通过GPT

2预训练模型自带的Bert编码器进行词向量编码;
[0013](2)在编码后的数据集上进行分类训练任务,将所有的n个文本数据视为(x1,x2,...,xn),将每个文本内容都认为是可变长度的符号序列(s1,s2,...,sm),所有的k个类别记为(y1,y2,...,yk),随后对每个s进行联合概率分布的计算,即得到每个文本内容出现的联合概率分布,同时联合概率可以拆分为多个条件概率的乘积,如下公式:
[0014][0015]在文本内容为x的情况下,可能类别的概率为p(y|x);
[0016](3)在训练过程中,对于文本内容x,对所有类别y的形如p(y
i
∣s1,s2,

,s
n

k
‑1)的条件概率,进行估计;
[0017](4)训练完成后,获得GPT

2分诊网络模型。
[0018]进一步的,所述步骤2中的GPT

2医疗问答网络模型训练采用中文GPT

2医疗问答预训练模型;所述中文GPT

2医疗问答预训练模型的训练包括:医疗问答训练数据的获取和GPT

2医疗问答网络模型自动训练。
[0019]进一步的,所述医疗问答训练数据的获取方法包括:编码处理和去噪处理;所述GPT

2医疗问答网络模型自动训练,具体步骤如下:
[0020](1)医疗问答训练数据的获取后形成的医疗问答数据,通过GPT

2预训练模型自带的Bert编码器进行词向量编码;
[0021](2)在编码后的数据集进上行文本生成训练任务,将所有的n个文本数据视为(x1,x2,...,xn),将每个文本内容都认为是可变长度的符号序列(s1,s2,...,sm),随后对每个s进行联合概率分布的计算,即得到每个文本内容出现的联合概率分布,同时联合概率可以拆分为多个条件概率的乘积,如下公式:
[0022][0023](3)在训练过程中,允许对p(x)以及形如p(s
n

k
,

,s
n
∣s1,s2,

,s
n

k
‑1)的所有条件概率设置可以追溯的取样和估计值,根据条件概率逐步使用GPT

2解码器解码;
[0024](4)训练完成后,获得GPT

2医疗问答网络模型。
[0025]进一步的,所述步骤3中的患者分诊分类包括:
[0026]患者问题输入:患者将想要得到回答的问题输入到系统中,输送至GPT

2分诊网络模型进行调用;
[0027]分诊网络模型调用:将患者的问题输入到分诊网络模型中,并将生成的分诊类别储存下来。
[0028]进一步的,所述根据所述患者信息,利用所述GPT

2分诊网络模型及所述GPT

2医疗问答网络模型确定所述患者的分诊分类及问题答案,包括:
[0029]获取所述患者信息中的分诊问题,将所述分诊问题输入所述GPT

2分诊网络模型
生成分诊分类,并存储所述分诊问题与所述分诊类别。
[0030]进一步的,所述根据所述患者信息,利用所述GPT

2分诊网络模型及所述GPT

2医疗问答网络模型确定所述患者的分诊分类及问诊答案,包括:
[0031]获取所述患者信息中的问诊问题,将所述问诊问题输入所述GPT

2分诊网络模型生成问诊答案,并存储所述问诊问题与所述问诊答案。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于GPT

2模型的智能分诊与医疗问答方法,其特征在于,所述方法包括:获取GPT

2分诊网络模型及GPT

2医疗问答网络模型;接收所述患者信息;根据所述患者信息,利用所述GPT

2分诊网络模型及所述GPT

2医疗问答网络模型确定所述患者的分诊分类及问诊答案;统计分析分诊分类及问诊答案。2.根据权利要求1所述的基于GPT

2模型的智能分诊与医疗问答方法,其特征在于,所述步骤1中的GPT

2分诊网络模型训练采用中文GPT

2分诊预训练模型;所述中文GPT

2分诊预训练模型的训练包括:分类训练数据标注和GPT

2分诊网络模型自动化训练。3.根据权利要求2所述的基于GPT

2模型的智能分诊与医疗问答方法,其特征在于,所述分类训练数据标注的处理包括:编码处理和去噪处理;所述GPT

2分诊网络模型自动化训练,具体步骤如下:(1)经分类训练数据标注后形成的分诊分类数据,通过GPT

2预训练模型自带的Bert编码器进行词向量编码;(2)在编码后的数据集上进行分类训练任务,将所有的n个文本数据视为(x1,x2,...,xn),将每个文本内容都认为是可变长度的符号序列(s1,s2,...,sm),所有的k个类别记为(y1,y2,...,yk),随后对每个s进行联合概率分布的计算,即得到每个文本内容出现的联合概率分布,同时联合概率可以拆分为多个条件概率的乘积,如下公式:在文本内容为x的情况下,可能类别的概率为p(y|x);(3)在训练过程中,对于文本内容x,对所有类别y的形如p(y
i
∣s1,s2,

,s
n

k
‑1)的条件概率,进行估计;(4)训练完成后,获得GPT

2分诊网络模型。4.根据权利要求1所述的基于GPT

2模型的智能分诊与医疗问答方法,其特征在于,所述步骤2中的GPT

2医疗问答网络模型训练采用中文GPT

2医疗问答预训练模型;所述中文GPT

2医疗问答预训练模型的训练包括:医疗问答训练数据的获取和GPT

2医疗问答网络模型自动训练。5.根据权利要求4所述的基于GPT

2模型的智能分诊与医疗问答方法,其特征在于,所述医疗问答训练数据的获取方法包括:编码处理和去噪处理;所述GPT

2医疗问答网络模型自动训练,具体步骤如下:(1)医疗问答训练数据获取后形成的医疗问答数据,通过GPT

2预训练模型自带的Bert编码器进行词向量编码;(2)在编码后的数据集上进行文本生成训练任务,将所有的n个文本数据视为(x1,x2,...,xn),将每个文本内容都认为是可变长度的符号序列(s1,s2,...,sm),随后对每个s进行联合概率分布的计算,即得到每个文本内容出现的联...

【专利技术属性】
技术研发人员:唐义鸿方淼
申请(专利权)人:东北大学秦皇岛分校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1