当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于TextCNN模型的临床儿童咳嗽智能预诊断系统技术方案

技术编号:32672951 阅读:24 留言:0更新日期:2022-03-17 11:28
本发明专利技术公开了一种基于TextCNN模型的临床儿童咳嗽智能预诊断系统,包括计算机存储器、计算机处理器以及存储在计算机存储器中并可在所述计算机处理器上执行的计算机程序,计算机存储器中存有训练好的语言表示模型、基于textCNN的疾病预诊断模型以及多标签任务学习的检验检查推荐模型;所述计算机处理器执行所述计算机程序时实现以下步骤:将临床儿童的问诊信息输入语言表示模型,得到语言特征表示向量;将语言特征表示向量输入到疾病预诊断模型,得到疾病的诊断结果;将语言特征表示向量和疾病的诊断结果输入到检验检查推荐模型中,得到推荐的检验检查项目。利用本发明专利技术,可以对咳嗽的儿童提供疾病预诊断和检查检验推荐,提高诊断精确度。高诊断精确度。高诊断精确度。

【技术实现步骤摘要】
一种基于TextCNN模型的临床儿童咳嗽智能预诊断系统


[0001]本专利技术属于医学人工智能领域,尤其是涉及一种基于TextCNN模型的临床儿童咳嗽智能预诊断系统。

技术介绍

[0002]咳嗽是导致儿童就诊最常见的症状,长期咳嗽可引起诸多并发症。引起咳嗽的病因众多,受限于医生经验水平的差异,临床咳嗽诊断存在误诊、不充分或多余的检查等问题。
[0003]公开机号为CN105339486A的中国专利文献公开了一种用于从患者收集样本以便诊断的系统和方法。样本收集和分析系统集中样本中源自患者咳嗽、喷嚏或者呼吸的颗粒,用于诊断患者呼吸道感染或者其它小疾病。样本收集和分析系统具有预先收集组件、与样本储器流体连通的收集器,所述预先收集组件和收集器组合执行功能:有效捕获由主体排出的空气体积,将排出的空气朝向样本储器引导,并且从排出的空气将所需粒径分离到样本储器中。
[0004]公开号为CN107242857A的中国专利文献公开了一种基于深度学习的智能中医综合诊疗系统,包括:望诊采集子系统、闻诊采集子系统、问诊采集子系统、脉诊采集子系统,以及综合分析子系统。其中,望诊采集子系统采集患者的面部、舌体等局部图像信息;闻诊采集子系统对患者语音、呼吸、咳嗽等声音信息进行采集;问诊采集子系统采用交互问答方式获取患者症状信息;脉诊采集子系统采集患者的脉搏信号;综合分析子系统采用深度学习相关理论和技术对以上子系统得到的信息数据进行综合分析,得到诊断结果并给出建议处方。该专利技术实现了中医望、闻、问、切四方面的结合,借助深度学习理论得到全面详实的诊断结果,为患者就诊提供了便利。
[0005]然而现有的技术中,只聚焦于诊断阶段,且依赖密集的特征工程,而对尚未展开检验检查的预诊阶段,并没有针对性的方法辅助基层医生通过问诊信息进行疾病预判和检查检验推荐。在实际诊疗中,收集患者的咳嗽、喷嚏或者呼吸的颗粒并进行辅助诊断需要依赖一定的设备,在临床操作中并不十分方便,大多数的咳嗽患儿也并不一定通过中医进行问诊,因此现有的技术在推广层面缺乏普适性。然而,对绝大多数患者来说,问诊是就诊过程必经也是首要的一步,直接影响到医生的后续判断及决策。基于病患问诊信息和优秀医生的诊疗经验进行智能预诊断辅助可以在就诊初始阶段即对基层医生的工作产生正向帮助。因此,亟需设计一种的儿童咳嗽预诊断技术解决方案。

技术实现思路

[0006]本专利技术提供了一种基于TextCNN模型的临床儿童咳嗽智能预诊断系统,可以对咳嗽的儿童提供疾病预诊断和检查检验推荐,提高诊断精确度。
[0007]一种基于TextCNN模型的临床儿童咳嗽智能预诊断系统,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,
所述计算机存储器中存有训练好的语言表示模型、基于textCNN的疾病预诊断模型以及多标签任务学习的检验检查推荐模型;
[0008]所述计算机处理器执行所述计算机程序时实现以下步骤:
[0009]将临床儿童的问诊信息输入语言表示模型,得到语言特征表示向量;
[0010]将语言特征表示向量输入到疾病预诊断模型,得到疾病的诊断结果;
[0011]将语言特征表示向量和疾病的诊断结果输入到检验检查推荐模型中,得到推荐的检验检查项目。
[0012]进一步地,所述的语言表示模型基于采用Word2vec中的Skip

Gram模型。
[0013]进一步地,采用大量医疗文献数据对语言表示模型进行训练,获取医学词汇在特征空间的语义表示向量;Skip

gram模型的训练目标是:最大化训练集中文本序列[w1,w2,w3,...,w
T
]的给定单词w
t
作为中心词时,固定大小窗口内的上下文单词w
t+j
的概率P(w
t+j
|w
t
),Skip

gram模型的目标函数表示为:
[0014][0015]式中,c为上下文窗口大小。
[0016]进一步地,采用负采样算法选择性地更新训练样本的小部分权重,加速梯度下降过程;
[0017]在负采样中,对于给定的词w,假设c表示它的上下文,那么词w是正例,其他词是负例,基于负采样的Skip

gram算法使用一元模型分布来选择负采样词,达到减少计算开销的目的;一个单词被选作负样本的概率跟它出现的频次有关,出现频次越高的单词越容易被选作负样本词;每个上下文词的概率计算公式如下:
[0018][0019]其中,f(w
i
)表示单词w出现的词频,分母代表所有单词的权重和;
[0020]基于负采样的Skip

gram模型的另一目标函数为找到使所有观测值来自数据的概率最大化的参数:
[0021][0022]P
pos
=p(D=1|c,w;θ)
[0023]P
neg
=p(D=0|c,w;θ)
[0024]式中,D表示上下文词集合,D

表示非上下文词的集合,w和c表示D中的单词,P
pos
表示w和c作为上下文词出现的概率,P
neg
表示w和c不作为非上下文词出现的概率。目标函数的意义为最大化窗口中上下文词的概率。
[0025]进一步地,所述疾病预诊断模型采用textCNN模型,将病例记录的文本进行One Hot编码后输入到训练好的语言表示模型中,经过word2vec词嵌入得到句子的语言特征表示向量,该向量将作为textCNN模型卷积层的输入。textCNN模型的网络结构如下:
[0026]卷积层中将kernel_size设置为(3,4,5),为了避免词向量信息丢失,卷积核宽度
设置与词向量维度相同,每个kernel_size有128个输出channel;网络初始化阶段采用Glorot_normal正态分布初始化方法,并在TextCNN网络中加入Batch Normalization网络重新调整数据分布后再进行池化的方法提高模型训练时的稳定性,生成3个长度为128的特征向量,再将其合并变为384维的向量后进行dropout。
[0027]疾病预诊断模型中,Softmax函数的计算公式如下:
[0028][0029]损失函数采用交叉熵,计算公式如下:
[0030][0031]其中,t
ki
是样本k属于类别i的概率,y
ki
是模型对样本k预测属于类别i的概率。
[0032]在训练疾病预诊断模型时,提取病人的病历记录,包括年龄、主诉症状、现病史、既往史、家族史、过敏史、用药情况7种属性;
[0033]对不同属性的文本去除停用词与特殊符号后进行自然语言式的拼接:对每条病例记录,将属性名与属性值拼接,并将不同属性拼接成一个短文本,作为病人信息的综合文本描述,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于TextCNN模型的临床儿童咳嗽智能预诊断系统,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于:所述计算机存储器中存有训练好的语言表示模型、基于textCNN的疾病预诊断模型以及多标签任务学习的检验检查推荐模型;所述计算机处理器执行所述计算机程序时实现以下步骤:将临床儿童的问诊信息输入语言表示模型,得到语言特征表示向量;将语言特征表示向量输入到疾病预诊断模型,得到疾病的诊断结果;将语言特征表示向量和疾病的诊断结果输入到检验检查推荐模型中,得到推荐的检验检查项目。2.根据权利要求1所述的基于TextCNN模型的临床儿童咳嗽智能预诊断系统,其特征在于,所述的语言表示模型基于采用Word2vec中的Skip

Gram模型。3.根据权利要求2所述的基于TextCNN模型的临床儿童咳嗽智能预诊断系统,其特征在于,采用大量医疗文献数据对语言表示模型进行训练,获取医学词汇在特征空间的语义表示向量;Skip

gram模型的训练目标是:最大化训练集中文本序列[w1,w2,w3,...,w
T
]的给定单词w
t
作为中心词时,固定大小窗口内的上下文单词w
t+j
的概率P(w
t+j
|w
t
),Skip

gram模型的目标函数表示为:式中,c为上下文窗口大小。4.根据权利要求3所述的基于TextCNN模型的临床儿童咳嗽智能预诊断系统,其特征在于,采用负采样算法选择性地更新训练样本的小部分权重,加速梯度下降过程;在负采样中,对于给定的词w,假设c表示它的上下文,那么词w是正例,其他词是负例,基于负采样的Skip

gram算法使用一元模型分布来选择负采样词,达到减少计算开销的目的;一个单词被选作负样本的概率跟它出现的频次有关,出现频次越高的单词越容易被选作负样本词;每个上下文词的概率计算公式如下:其中,f(w
i
)表示单词w出现的词频,分母代表所有单词的权重和;基于负采样的Skip

gram模型的另一目标函数为找到使所有观测值来自数据的概率最大化的参数:...

【专利技术属性】
技术研发人员:俞刚朱珠李竞张洪健陈思宇钟千惠王颖硕王玉琪
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1