用于医院内感染预测的模型训练方法、装置、设备及介质制造方法及图纸

技术编号:21344278 阅读:27 留言:0更新日期:2019-06-13 22:45
本发明专利技术适用计算机技术领域,提供了一种用于医院内感染预测的模型训练方法、装置、设备及介质,该方法包括:根据由患有院内感染的第一感染训练样本组成的第一训练样本集,使用生成对抗网络模型的生成器生成对应的第二感染训练样本,根据第一训练样本集和由第二感染训练样本构成的第二训练样本集,通过主动学习算法对高斯过程概率模型进行院内感染预测的迭代训练,直至通过迭代训练使得高斯过程概率模型的预测精度值达到预设精度要求,从而提高用于医院内感染预测的模型训练收敛速度,且提高了院内感染预测的准确性,进而使得医生能及时对患者进行感染防御,降低患者由于院内感染所造成的金钱和健康损失。

Model training methods, devices, equipment and media for Nosocomial Infection Prediction

The invention is applicable to the field of computer technology, and provides a model training method, device, equipment and medium for predicting nosocomial infection. The method includes: according to the first training sample set composed of the training sample of the first infection with nosocomial infection, using the generator generating the antagonistic network model to generate the corresponding second infection training sample, and according to the first training sample set. And the second training sample set consisting of the second infection training sample set, through the iterative training of Gauss process probability model for nosocomial infection prediction by active learning algorithm, until the prediction accuracy of Gauss process probability model meets the preset accuracy requirement through iterative training, thus improving the convergence speed of model training for nosocomial infection prediction, and improving nosocomial infection prediction. The accuracy of the prediction will enable doctors to defend patients against infection in time and reduce the financial and health losses caused by nosocomial infection.

【技术实现步骤摘要】
用于医院内感染预测的模型训练方法、装置、设备及介质
本专利技术属于计算机
,尤其涉及一种用于医院内感染预测的模型训练方法、装置、设备及介质。
技术介绍
医院内感染又称医院获得性感染或医院感染,是患者在入院48小时后发生在医院内的一切感染,全国二、三级医院感染的发生率基线约4-6%,而发生医院感染的后果可能会造成每年数十亿人民币的经济损失,患者病死率上升,间接的社会资源浪费更是不可估量。目前,对于住院病人院内感染的判断大多是出现了相应的症状之后,由主治医师初步判定,再由院各科做最后判定,以进行诊断,这种方式主要依靠医生的临床知识和经验,诊断效率低,且无法做到有效防范院内感染的发生,进而无法有效保障就医患者的人身和财产安全。
技术实现思路
本专利技术的目的在于提供一种用于医院内感染预测的模型训练方法、装置、设备及介质,旨在解决由于现有技术无法提供一种有效的用于医院内感染预测的模型,导致医院内感染预测的准确率低的问题。一方面,本专利技术提供了一种用于医院内感染预测的模型训练方法,所述方法包括下述步骤:从预设的医院信息系统中抽取患有院内感染的样本数据,得到对应的第一感染训练样本;根据由所述第一感染训练样本构成的第一训练样本集,使用预先训练好的生成对抗网络模型的生成器生成对应的第二感染训练样本;根据所述第一训练样本集和由所述第二感染训练样本构成的第二训练样本集,通过预设的主动学习算法对高斯过程概率模型进行院内感染预测的迭代训练,直至通过所述迭代训练使得所述高斯过程概率模型的预测精度值达到预设的精度要求。另一方面,本专利技术提供了一种用于医院内感染预测的模型训练装置,所述装置包括:第一样本抽取单元,用于从预设的医院信息系统中抽取患有院内感染的样本数据,得到对应的第一感染训练样本;第二样本生成单元,用于根据由所述第一感染训练样本构成的第一训练样本集,使用预先训练好的生成对抗网络模型的生成器生成对应的第二感染训练样本;以及模型预测训练单元,用于根据所述第一训练样本集和由所述第二感染训练样本构成的第二训练样本集,通过预设的主动学习算法对高斯过程概率模型进行院内感染预测的迭代训练,直至通过所述迭代训练使得所述高斯过程概率模型的预测精度值达到预设的精度要求。另一方面,本专利技术还提供了一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述用于医院内感染预测的模型训练方法所述的步骤。另一方面,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述用于医院内感染预测的模型训练方法所述的步骤。本专利技术根据由患有院内感染的第一感染训练样本组成的第一训练样本集,使用生成对抗网络模型的生成器生成对应的第二感染训练样本,根据第一训练样本集和由第二感染训练样本构成的第二训练样本集,通过主动学习算法对高斯过程概率模型进行院内感染预测的迭代训练,直至通过迭代训练使得高斯过程概率模型的预测精度值达到预设精度要求,从而提高用于医院内感染预测的模型训练收敛速度,且提高了院内感染预测的准确性,进而使得医生能及时对患者进行感染防御,降低患者由于院内感染所造成的金钱和健康损失。附图说明图1是本专利技术实施例一提供的用于医院内感染预测的模型训练方法的实现流程图;图2是本专利技术实施例二提供的对高斯过程概率模型进行院内感染预测的迭代训练的实现流程图;图3是本专利技术实施例三提供的用于医院内感染预测的模型训练装置的结构示意图;图4是本专利技术实施例三提供的用于医院内感染预测的模型训练装置的优选结构示意图;以及图5是本专利技术实施例四提供的计算设备的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。以下结合具体实施例对本专利技术的具体实现进行详细描述:实施例一:图1示出了本专利技术实施例一提供的用于医院内感染预测的模型训练方法的实现流程,为了便于说明,仅示出了与本专利技术实施例相关的部分,详述如下:在步骤S101中,从预设的医院信息系统中抽取患有院内感染的样本数据,得到对应的第一感染训练样本。本专利技术实施例适用于医学计算处理平台、设备或系统,例如,个人计算机、服务器等。在预设的医院信息系统(HospitalInformationSystem,HIS)数据库中存储的所有数据属性中确定数据抽取属性,根据确定的数据抽取属性,利用SQL语句从HIS数据库中抽取患有院内感染的样本数据,抽取出的所有样本数据即为基础带标记的第一感染训练样本,也即正类样本,其中,数据抽取属性包括:年龄、住院次数、住院天数、是否抢救病人、是否月内再次入院、总花费、病人血型、是否手术、是否并发症、是否药物过敏、疾病分型等。在从医院信息系统中抽取患有院内感染的样本数据时,优选地,将抽取出的样本数据进行预处理,得到对应的第一感染训练样本,从而降低第一感染训练样本中的噪声,提高第一感染训练样本的可用性。在将抽取出的样本数据进行预处理时,优选地,通过下述步骤实现对样本数据的预处理:1)对样本数据进行缺失值处理,具体地,在患有院内感染的样本数据中,若同一数据属性对应的数值缺失的样本数据数量大于第一数量阈值时,则将数值缺失的数据属性对应的样本数据进行删除,若同一数据属性对应的数值缺失的样本数据数量小于第二数量阈值时,则取其前后三个其它样本数据中对应数据属性的正常数值的平均值,以该平均值进行缺失值填充;2)对缺失值处理后得到的样本数据进行异常值处理,具体地,通过四分位距(InterquartileRange,IQR)的方法判断样本数据中各数据属性对应的数值是否小于第一异常值(QL-1.5IQR)或者大于第二异常值异常(QU+1.5IQR),若存在异常数值,则将异常数值从该样本数据中删除,或者取若干其它样本数据中对应数据属性的正常数值的平均值,将异常数值替换为该平均值,或者将该异常数值视为缺失值,利用拉格朗日插值法进行数据拟合,以填补该异常数值,其中IQR=F-1(0.75)-F-1(0.25),下四分位数QL=F-1(0.25)表示样本数据中各数据属性对应的所有数值由小到大排列后第25%的数值,上四分位数QU=F-1(0.75)表示样本数据中各数据属性对应的所有数值由小到大排列后第75%的数值;3)将连续性的样本数据进行等值离散化处理,以使得所有样本数据统一化;4)通过正太标准化(Z-score标准化)方法将等值离散化处理后得到的样本数据进行归一化处理;5)将归一化处理后得到的样本数据进行数据降维,得到对应的第一感染训练样本,例如,将样本数据缩小到二维空间,使得得到的第一感染训练样本可以可视化,进而可以直观了解第一感染训练样本的大致分布。通过上述步骤1)-步骤5)实现对患有院内感染的样本数据的预处理,从而降低得到的第一感染训练样本中的噪声,提高第一感染训练样本的可用性和可靠性。在步骤S102中,根据由第一感染训练样本构成的第一训练样本集,使用预先训练好的生成对抗网络模型的生成器生成对应的第二感染训练样本。在本专利技术实施例中,生成对抗网络(GenerativeAdversari本文档来自技高网...

【技术保护点】
1.一种用于医院内感染预测的模型训练方法,其特征在于,所述方法包括下述步骤:从预设的医院信息系统中抽取患有院内感染的样本数据,得到对应的第一感染训练样本;根据由所述第一感染训练样本构成的第一训练样本集,使用预先训练好的生成对抗网络模型的生成器生成对应的第二感染训练样本;根据所述第一训练样本集和由所述第二感染训练样本构成的第二训练样本集,通过预设的主动学习算法对高斯过程概率模型进行院内感染预测的迭代训练,直至通过所述迭代训练使得所述高斯过程概率模型的预测精度值达到预设的精度要求。

【技术特征摘要】
1.一种用于医院内感染预测的模型训练方法,其特征在于,所述方法包括下述步骤:从预设的医院信息系统中抽取患有院内感染的样本数据,得到对应的第一感染训练样本;根据由所述第一感染训练样本构成的第一训练样本集,使用预先训练好的生成对抗网络模型的生成器生成对应的第二感染训练样本;根据所述第一训练样本集和由所述第二感染训练样本构成的第二训练样本集,通过预设的主动学习算法对高斯过程概率模型进行院内感染预测的迭代训练,直至通过所述迭代训练使得所述高斯过程概率模型的预测精度值达到预设的精度要求。2.如权利要求1所述的方法,其特征在于,从预设的医院信息系统中抽取患有院内感染的样本数据的步骤,包括:将抽取出的所述样本数据进行预处理,得到所述第一感染训练样本。3.如权利要求1所述的方法,其特征在于,在通过预设的主动学习算法对高斯过程概率模型进行院内感染预测的迭代训练的步骤,包括:通过所述第一训练样本集对所述高斯过程概率模型进行院内感染预测训练,并记录院内感染预测训练后的所述高斯过程概率模型的预测精度值;当所述预测精度值未达到所述精度要求时,使用所述高斯过程概率模型对所述第二训练样本集中的每个第二感染训练样本进行院内感染预测,得到对应的院内感染概率;根据所述院内感染概率,使用预设的基于不确定性的样本选择策略从所述第二训练样本集中选择预设数量个第二感染训练样本;将选择出的所述第二感染训练样本加入所述第一训练样本集中,更新所述第一训练样本集,并相应的更新所述第二训练样本集。4.如权利要求3所述的方法,其特征在于,使用预设的基于不确定性的样本选择策略从所述第二训练样本集中选择预设数量个第二感染训练样本的步骤,包括:根据所述院内感染概率,使用预设的不确定性分数计算函数得到所述第二训练样本集中的每个第二感染训练样本对应的不确定性分数;根据预设的相似性分数计算函数计算所述每个第二感染训练样本与所述第一训练样本集中的每个第一感染训练样本的相似度,得到所述每个第二感染训练样本对应的相似性分数;根据所述不确定性分数和所述相似性分数,使用预设的综合分数计算函数得到所述每个第二感染训练样本对应的综合分数;根据所述综合分数,从所述第二训练样本集中选择预设数量个第二感染训练样本。5.一种用于医院内感染预测的模型训练装置,其特征在于,所述装置包括:第一样本抽取单元,用于从预设的医院信息系统中抽取患有院内感染的样本数据,得到对应的第一感染训练样本;第二样本生成单元,用于根据由所述第一感...

【专利技术属性】
技术研发人员:邓根强祝苗苗朱岁松
申请(专利权)人:深圳市南山区人民医院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1