【技术实现步骤摘要】
基于特权信息学习支持向量机的CAP数据系统及方法
本专利技术涉及信息处理
,尤其是涉及一种基于特权信息学习支持向量机的CAP数据系统及方法。
技术介绍
儿童社区获得性肺炎(communityacquiredpneumonia,CAP)是指既往健康儿童在院外(即社区)由细菌、病毒、衣原体和支原体等多种微生物感染所致的肺炎。该病是儿童时期最常见的呼吸系统感染性疾病之一,是儿童住院的最常见原因之一。据统计,我国住院儿童的24.5%-56.2%的病因是儿童肺炎;根据权威医学期刊《柳叶刀》于2010年发表的研究,社区获得性肺炎(CAP)是中国的儿童患病死亡首因,我国卫生部将其列为4种儿童常见病之首。儿童社区获得性肺炎由多种病原引起,其中细菌、病毒、支原体、衣原体这几类最为常见,也有不少是多于一种病原的混合感染。修订于2013年的《儿童社区获得性肺炎管理指南》指出,影响CAP病原检测发现的因素包括:(1)CAP患儿自身的免疫状况、病原的繁殖数量与毒力作用,以及抗菌素等的使用对前二者的影响等综合因素;(2)各种标本采集、保管、运送、检验等各个流程环节的标准化、衔接与密切配 ...
【技术保护点】
一种基于特权信息学习支持向量机的CAP数据系统,其特征在于,包括:依次连接的医疗数据处理模块、医疗数据特征生成与特权信息提取模块、病原分析模块;所述医疗数据处理模块,用于对大量CAP患儿的医疗数据进行筛选并进行统计分析;所述的医疗数据特征生成与特权信息提取模块,用于按照检测时间将检测项目区分为普通医疗数据特征与特权信息,生成医疗数据特征矩阵和特权信息矩阵,并输入病原分析模块;所述病原分析模块通过基于特权信息学习的SVM+算法训练,形成儿童CAP早期病原诊断数据模型。
【技术特征摘要】
1.一种基于特权信息学习支持向量机的CAP数据系统,其特征在于,包括:依次连接的医疗数据处理模块、医疗数据特征生成与特权信息提取模块、病原分析模块;所述医疗数据处理模块,用于对大量CAP患儿的医疗数据进行筛选并进行统计分析;所述的医疗数据特征生成与特权信息提取模块,用于按照检测时间将检测项目区分为普通医疗数据特征与特权信息,生成医疗数据特征矩阵和特权信息矩阵,并输入病原分析模块;所述病原分析模块通过基于特权信息学习的SVM+算法训练,形成儿童CAP早期病原诊断数据模型。2.一种采用权利要求1所述数据系统的方法,其特征在于,包括以下步骤:第一步,筛选出有效的CAP患儿列表,以及与这些CAP患儿相关的有效数据;第二步,对所有筛选出的有效数据进行统计,选择其中部分项目作为特权信息,其余的有效数据显示为普通医疗数据特征;第三步,将选择出的患儿检测项目结果以及患儿信息生成关于每一个有效CAP患儿的医疗数据特征矩阵,并选择特权信息,形成有效CAP患儿的特权信息矩阵;第四步,建立基于特权信息学习支持向量SVM+算法,并利用该算法,使用第三步生成的两个矩阵,建立基于特权信息学习支持向量机的儿童社区获得性肺炎数据模型。3.根据权利要求2所述的方法,其特征在于,所述第一步中,CAP患儿相关的有效数据筛选,具体包括以下步骤:1.1)对所有医疗检测数据进行初级筛选,去除其中信息不全,或者结果无法量化的部分;1.2)对每一个CAP患儿的确诊性以及病原确定性进行筛查,并确保该患儿在数据源中有超过设定数量的有效检测数据记录,输出一个有效的CAP患儿列表;1.3)针对每一个有效的CAP患儿样例,收集有效患儿信息、医疗检测信息。4.根据权利要求2所述的方法,其特征在于,所述第二步中,特权信息筛选,具体包括以下步骤:2.3.1)根据病原分析的经验,选择设定的指标检测项目作为特权信息,其中设定的指标检测项目包括病毒PRC检测、细菌培养结果;2.3.2)根据检测项目时间,平均时间超过早期诊断时间的项目,确定为特权信息;2.3.3)其余的病人信息以及其余检测项目信息则作为普通医疗数据特征信息。5.根据权利要求2所述的方法,其特征在于,所述第三步中,将选择出的患儿检测项目结果以及患儿信息生成关于每一个有效CAP患儿的医疗数据特征矩阵,并选择特权信息,形成有效CAP患儿的特权信息矩阵,具体包括以下步骤:3.1)根据已知患儿信息计算患儿年龄,并将入院季节数值加入医疗数据特征矩阵,其中患儿信息包括出生日期和入院日期;3.2)将检测项目结果进行数据挖掘处理;3.3)将经过数据处理和挖掘数值化的检测结果分别生成医疗数据特征矩阵与特权信息矩阵。6.根据权利要求5所述的方法,其特征在于,所述3.2)将检测项目结果进行数据挖掘处理具体为:一部分数据通过数据处理中常见的归一化步骤,直接被作为一个维度的医疗数据特征;而对于非标准数值的检测项目结果,包括正常N、偏高H、偏低L,一部分的检测项目结果为医学上通用的化验检测结果,包括阳性P、阴性N、可疑S,还有一部检测结果为按照程度进行的分级,包括1-9级,其中1级表示轻微,9级表示严重;为了能将这些结果中的检测项目进行数据分析,需要根据如下的规则将这些结果转化为数字,从而进行数据处理和挖掘,并且这些数字需要符合其他数值型结果归一化之后的规律:3.2.1)正常N、偏高H、偏低L分别对应数字-1,0,1;3.2.2)阳性P、阴性N、可疑S分别对应数字1,0,0.5;3.2.3)1-9级根据公式x-1/10转化为数字。7.根据权利要求5所述的方法,其特征在于...
【专利技术属性】
技术研发人员:邵欣蔚,金博,舒林华,查宏远,于广军,
申请(专利权)人:华东师范大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。