本发明专利技术公开了一种基于机器学习的布鲁氏菌病筛查率提升方法,包括以下步骤:S1、建立阳性倾斜模型,在训练模型中加重阳性权重,提升模型阳性检出率,报告阳性样本;S2、阳性样本进入问卷调查环节;S3、结合问卷调查结果及阳性患病概率,综合分析布鲁氏菌病的患病风险,并推送医生端。本发明专利技术所述的一种基于机器学习的布鲁氏菌病筛查率提升方法,将机器学习与问卷进行整合,首先通过阳性倾斜模型,提升模型阳性检出率;机器学习模型报告为阳性后,进入问卷环节,排出假阳性;从而提高了布鲁氏菌病筛查率;解决布鲁氏菌病筛查率低的问题。解决布鲁氏菌病筛查率低的问题。
【技术实现步骤摘要】
一种基于机器学习的布鲁氏菌病筛查率提升方法
[0001]本专利技术涉及医疗数据处理
,尤其是涉及一种基于机器学习的布鲁氏菌病筛查率提升方法。
技术介绍
[0002]临床存在很多疾病在前期症状特征比较微弱,尤其有些重病的潜伏期隐秘,即使存在某些症状有时往往因为患者本身的认知不足导致疾病的耽误或错诊情况。以布鲁氏菌病(简称布病)为例,布病属于我国《传染病防治法》规定的乙类传染病,根据临床病程分为急、慢性期。急性期临床患者表现为非特异性的发热(包括低热)、乏力、多汗、肌肉、关节疼痛等症状,常易与其他发热性疾病,如:发烧,感冒、风湿病和结核病等混淆,临床难以早期诊断,这不仅使临床干预时间窗缩短,而且增大了转为慢性期并引发严重并发症的风险。另外,早期发现布病隐性感染者,亦是传染性疾病面临的挑战。为此,如何实现对非典型临床症状布病患者早期诊断以及早期筛查布病隐性感染者,是布病诊疗中亟待解决问题。影响疾病早期的临床诊断因素很多,一方面是患者本身的重视和意识程度,另一方面在临床诊断过程中针对某些疾病也会存在一定的漏诊错诊情况。
[0003]人工智能(AI)技术融合了多领域多学科的知识,是当今科技发展的代表性前沿技术。该技术在医学影像、病理、辅助决策等方面取得了长足的进展,许多AI产品已经从实验阶段过渡到了临床应用阶段。机器学习作为人工智能研究的核心技术,近年来在生物医学数据与图像的分析及识别、疾病预测、精准医学治疗等方面的研究已逐渐广泛。机器学习作为人工智能的重要技术手段,主要是从数据中学习处理复杂的任务,有较强的拟合能力,但同时对数据存在强依赖,即特征和数据量。当数据质量不佳时,模型也会对实际问题的解决存在偏误。其次摆脱临床属性的机器学习是不被客观接受和不受解释的。
[0004]疾病问卷在临床领域的意义非常重要,问卷即是一种“望闻问切”的另一种体现形式,医生了解患者基本情况后结合自己的临床医学经验,对患者疾病进行推断,那么问卷就是患者身体状况的基本体现,对患者的疾病诊断及程度鉴别具备很大的参考意义,对医生的诊断起到很大的辅助作用。但疾病问卷通常存在较大的人为因素,取决与被测患者自身的认知和态度,在大规模筛查中通常效果大打折扣。
技术实现思路
[0005]本专利技术的目的是提供一种基于机器学习的布鲁氏菌病筛查率提升方法,解决布鲁氏菌病筛查率低的问题。
[0006]为实现上述目的,本专利技术提供了一种基于机器学习的布鲁氏菌病筛查率提升方法,包括以下步骤:
[0007]S1、建立阳性倾斜模型,在训练模型中加重阳性权重,提升模型阳性检出率,报告阳性样本;
[0008]S2、阳性样本进入问卷调查环节;
[0009]S3、结合问卷调查结果及阳性患病概率,综合分析布鲁氏菌病的患病风险,并推送医生端。
[0010]优选的,建立阳性倾斜模型的具体步骤为:
[0011]S11、数据预处理,收集数据,并清洗处理数据,将数据处理为符合机器学习的结构化表格或矩阵类型的结构化数据,处理数据缺失值,处理异常数据;
[0012]S12、特征工程,从结构化数据中提取或增强与标签或问题相关的特征;
[0013]S13、模型训练,基于结构化数据及目标问题,利用算法对数据进行学习迭代,形成机器学习算法经验,用于问题的预测,形成模型;
[0014]S14、模型调优,基于效能指标和损失情况进行训练效果评估,如未达到预期则调优迭代,直至模型效果符合预期,模型训练成功。
[0015]优选的,所述S11中数据包括确诊为布鲁氏菌病的体检样本和非布鲁氏菌病人群体检样本;样本数据为血常规、患者年龄、性别,其中确诊为布鲁氏菌病的体检样本的血常规数据为首诊血常规。
[0016]优选的,所述S12具体步骤为:
[0017]S121、将所有类别维度数值化或编码化;
[0018]S122、为结构化数据增加标签列;
[0019]S123、对各个维度进行数据标准化;
[0020]S124、拆分训练集、测试集,对标准化完成后的数据按照9:1数量比例抽取训练集和测试集;
[0021]S125、存在类别数据不平衡时,利用过采样方法将数据取平。
[0022]优选的,所述S13具体为:基于特征工程后的数据利用神经网络训练分类任务,初始化网络参数,并设置模型轮次验证,观察模型初次训练效果;如存在验证集准确率、敏感度、特异度指标不理想,则增加神经元数量和网络深度进行增强,对compile方法内部及fit方法内部参数进行调整测试,提升模型效能。
[0023]优选的,所述S14具体为:设置预测阈值,在模型训练完成后,降低预测阈值来提升模型敏感度,使得模型偏向于阳性检出效能。
[0024]优选的,所述S2具体包括以下步骤:
[0025]S21、依据布鲁氏菌病的临床知识抽取其典型特征、流行病史作为问卷题目;
[0026]S22、抽取患有布鲁氏菌病的病例若干例和未患有布鲁氏菌病的病例若干例,对问卷进行测试,估算问卷对于疾病的区分效能、敏感度、特异度、准确率;
[0027]S23、为问卷划定分值范围,与疾病的风险相关联。
[0028]本专利技术所述的一种基于机器学习的布鲁氏菌病筛查率提升方法,将机器学习与问卷进行整合,首先通过阳性倾斜模型,提升模型阳性检出率。布病阳性的筛查率可以达到86%以上,阴性的筛查率达到90%以上。机器学习模型报告为阳性后,进入问卷环节,排出假阳性;从而提高了布鲁氏菌病筛查率。
具体实施方式
[0029]以下通过实施例对本专利技术的技术方案作进一步说明。
[0030]实施例
[0031]一种基于机器学习的布鲁氏菌病筛查率提升方法,包括以下步骤:
[0032]S1、建立阳性倾斜模型,在训练模型中加重阳性权重,提升模型阳性检出率,报告阳性样本。
[0033]用于评估患者指标是否具有患病风险,或是否患有某种疾病,属于机器学习有监督二分类问题。在二分类问题的模型训练过程中,可利用阈值调控、分类权重控制等手段,刻意使模型效能偏向于敏感度,即使模型偏向于阳性检出效能。这样做会使得模型在二分类的效能上出现不平衡,即损失特异性精度,故称作阳性倾斜模型。
[0034]建立阳性倾斜模型的具体步骤为:
[0035]基于Tensorflow2.0版本作为模型构建工具。
[0036]S11、数据预处理,收集数据,并清洗处理数据,将数据处理为符合机器学习的结构化表格或矩阵类型的结构化数据,处理数据缺失值,根据缺失情况进行直接剔除或填补;处理异常数据,即单位量纲不一致或存在取值异常的样本。
[0037]S11中数据包括确诊为布鲁氏菌病的体检样本N份,作为有监督二分类问题阳性类;非布鲁氏菌病人群体检样本M份,作为有监督二分类问题阴性类。整体数据量越大越好。
[0038]样本数据为血常规、患者年龄、性别,血常规为22项目,共计24个特征维度。血常规的项目及标准范围可以如表1所示:<本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的布鲁氏菌病筛查率提升方法,其特征在于,包括以下步骤:S1、建立阳性倾斜模型,在训练模型中加重阳性权重,提升模型阳性检出率,报告阳性样本;S2、阳性样本进入问卷调查环节;S3、结合问卷调查结果及阳性患病概率,综合分析布鲁氏菌病的患病风险,并推送医生端。2.根据权利要求1所述的一种基于机器学习的布鲁氏菌病筛查率提升方法,其特征在于,建立阳性倾斜模型的具体步骤为:S11、数据预处理,收集数据,并清洗处理数据,将数据处理为符合机器学习的结构化表格或矩阵类型的结构化数据,处理数据缺失值,处理异常数据;S12、特征工程,从结构化数据中提取或增强与标签或问题相关的特征;S13、模型训练,基于结构化数据及目标问题,利用算法对数据进行学习迭代,形成机器学习算法经验,用于问题的预测,形成模型;S14、模型调优,基于效能指标和损失情况进行训练效果评估,如未达到预期则调优迭代,直至模型效果符合预期,模型训练成功。3.根据权利要求2所述的一种基于机器学习的布鲁氏菌病筛查率提升方法,其特征在于:所述S11中数据包括确诊为布鲁氏菌病的体检样本和非布鲁氏菌病人群体检样本;样本数据为血常规、患者年龄、性别,其中确诊为布鲁氏菌病的体检样本的血常规数据为首诊血常规。4.根据权利要求3所述的一种基于机器学习的布鲁氏菌病筛查率提升方法,其特征在于,所述S12具体步骤为:S121、...
【专利技术属性】
技术研发人员:陈超,宋彪,冯祥,
申请(专利权)人:内蒙古卫数数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。