2型糖尿病发病危险因素对血糖影响的定量分析方法技术

技术编号：8907258 阅读：243 留言：0更新日期：2013-07-11 04:56

本发明专利技术涉及2型糖尿病发病危险因素对血糖影响的定量分析方法，属于生物信息处理及医学领域。本发明专利技术首先使用C4.5和EM聚类算法实现重要发病危险因素的选择；再根据性别和年龄对全体人群进行划分，进而利用BP神经网络算法对细化人群进行敏感度计算，最终通过敏感度实现多因素对血糖影响的定量分析。与现有大量统计学方法相比，本发明专利技术采用数据挖掘方法，在充分考虑多因素之间相互影响的同时，在细化人群中实现多因素对血糖影响的定量分析，大大提高了定量分析的准确率，并可为个体发病的细化干预提供判定方法。本发明专利技术可对个体2型糖尿病发病进行干预指导，不仅可以预防或延缓发病，而且该方法可应用推广到其它疾病危险因素的定量分析。

全部详细技术资料下载

【技术实现步骤摘要】
2型糖尿病发病危险因素对血糖影响的定量分析方法
本专利技术涉及一种多因素对血糖影响的定量分析方法，属于生物信息处理及医学领域。
技术介绍
2型糖尿病已经成为世界性的一个主要健康问题。预计到2025年，全世界将有3.8亿人受到糖尿病的困扰。目前，我国已成为仅次于印度的糖尿病第二大国。据卫生部调查显示，我国糖尿病患者每天约新增3000例，每年约新增120万例，其中约95%为2型糖尿病患者。2型糖尿病已成为继癌症和心脑血管病之后，位于第三位严重影响人类健康的慢性病，其病因是环境因素、遗传因素、生活方式等相互作用的结果。目前已经获得共识的患病危险因素包括增龄、肥胖超重、血脂、血压水平异常、糖尿病家族史等，多因素共同作用对血糖水平升高产生影响，进而导致发病。由于2型糖尿病一旦发病难以治愈，如果在发病前对危险因素进行干预，能够有效降低发病率，提高生活质量。相关研究大多采用多元回归、元分析、cox回归等统计学方法，利用相对危险度研究危险因素与是否发病之间的关系。哈佛大学HuFB等人的研究表明超重和肥胖是发生2型糖尿病的最重要因素。通过对比发现，3.4%处于低危险组女性发生糖尿病的相对危险度为0.09，91%的发病者是由于不健康生活习惯造成的。MhurchuCN等人采用cox回归方法报道了亚太地区人群的体重指数和糖尿病发生之间联系，发现在该地区降低体重指数能有效降低糖尿病的发病率。或采用多元回归算法和元分析，研究通常用相对危险度说明某一因素是否是发生2型糖尿病相关的危险因素，给出定性的结论。本专利技术采用BP神经网络算法计算敏感度，量化衡量危险因素对血糖变化的影响，通过敏...
2型糖尿病发病危险因素对血糖影响的定量分析方法

【技术保护点】
2型糖尿病发病危险因素对血糖影响的定量分析方法，其特征在于，所述方法包括以下步骤：步骤1，获取人群体检数据，形成未患有2型糖尿病的全国抽样人群体检数据源S。步骤2，对数据源S筛选引起2型糖尿病的主要危险因素。步骤3，根据性别和年龄，对经步骤2得到的全国抽样人群体检数据源S进行划分，生成细化人群。步骤4，使用经步骤3得到的细化人群分别训练BP神经网络模型，进而计算出不同危险因素对血糖影响的敏感度，利用敏感度实现定量分析。

【技术特征摘要】
1.2型糖尿病发病危险因素对血糖影响的定量分析方法，其特征在于，所述方法包括以下步骤：步骤1，对2001-2008年实测体检数据，进行数据清理，填充空缺值、识别孤立点、消除噪声并纠正数据中的不一致；再进行数据变换，包括数据格式转换、数据语义转换；最后在保证信息不丢失的情况下，通过数据归约删除重复因素和空缺值较多的因素，形成未患有2型糖尿病的全国抽样人群体检数据源S；步骤2，对数据源S采用EM聚类算法进行危险因素的粗选，然后采用融合EM聚类和C4.5算法的危险因素精选方法，筛选引起2型糖尿病的主要危险因素；步骤3，根据性别和年龄，对经步骤1得到的全国抽样人群体检数据源S进行划分，基于步骤2获得危险因素对9组细化人群分别训练BP神经网络模型，基于BP神经网络权重，采用一种多因素综合作用下的敏感度计算方法，计算出不同危险因素对血糖影响的敏感度，进而实现定量分析；其中，所述多因素综合作用下的敏感度计算方法为：设有n-L-1前向网络,式中n为BP神经网络模型输入变量的个数，L为BP神经网络模型的隐含层数目，1为模型输出变量的个数，网络输出有如下形式：y＝f(x1，…，xn)，式中x为BP神经网络模型的输入，y为BP神经网络模型的输出，通过对该式求二阶偏导来考察输入变量对输出变量的敏感度，设神经网络的隐层激活函数为对数S型函数通过雅克比矩阵式中：T为矩阵的转置运算，m为所用数据源的样本数目，n为输入变量的个数，把第j个输入xj变化与第j个输出yj＝f(xj)改变联系起来意味着网络输出的敏感度依赖于输入的微小扰动，对于n个输入、具有L个神经元的隐含层和一个输出层的神经网络，第t个样本上输入变量xi和xk对输出变量y的敏感度为式中：S1为输出层激活函数对其输入的一阶导数，S2为输出层激活函数对其输入的二阶导数，为第t个样本上第j个隐层神经元的响应，vj1为输出神经元和第j个隐层神经元间的权重，wij为第i个输入神经元和第j个隐层神经元间的权重，wkj为第k个输入神经元和第j个隐层神经元间的权重。2.根据权利要求1所述的方法，其特...

【专利技术属性】
技术研发人员：罗森林，陈松景，潘丽敏，韩龙飞，张铁梅，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人