糖尿病分析方法及应用服务器技术

技术编号:17616474 阅读:54 留言:0更新日期:2018-04-04 07:28
本发明专利技术公开了一种糖尿病分析方法,该方法包括:设置样本范围,包括用户范围和数据维度;根据所设置的样本范围,获取相应的样本数据;对所述样本数据中的各个数据维度与糖尿病或并发症的关系进行关联分析,其中,将是否患糖尿病或并发症作为关联规则的右项集,其他数据维度作为左项集;输出关联分析结果。本发明专利技术还提供一种应用服务器及计算机可读存储介质。本发明专利技术提供的糖尿病分析方法、应用服务器及计算机可读存储介质能够利用大数据进行关联分析,得到各类不同用户患糖尿病的几率、糖尿病患者产生其他并发症的几率、以及糖尿病与其他影响因素之间的关系,帮助潜在糖尿病及其并发症患者提早预防。

Diabetes analysis method and application server

【技术实现步骤摘要】
糖尿病分析方法及应用服务器
本专利技术涉及数据分析
,尤其涉及一种糖尿病分析方法及应用服务器。
技术介绍
糖尿病是一组由多病因引起的以慢性高血糖为特征的终身性代谢性疾病。长期血糖增高,大血管、微血管受损并危及心、脑、肾、周围神经、眼睛、足等,据世界卫生组织统计,糖尿病并发症高达100多种,是目前已知并发症最多的一种疾病。糖尿病死亡者有一半以上是心脑血管所致,10%是肾病变所致。因糖尿病截肢的患者是非糖尿病的10~20倍。临床数据显示,糖尿病发病后10年左右,将有30%~40%的患者至少会发生一种并发症,且并发症一旦产生,药物治疗很难逆转,因此强调尽早预防糖尿病并发症。糖尿病的发病存在三方面因素:遗传、环境因素和生理性老化引起胰岛素抵抗和胰岛素作用不足。根据糖尿病并发症发病的急缓以及病理上的差异,可将其分为急性和慢性两大类。传统医学上,由于并发症的多样化导致并发症的确诊较为复杂,时间开销很大,很容易耽误治疗及预防时间。
技术实现思路
有鉴于此,本专利技术提出一种糖尿病分析方法及应用服务器,以解决如何有效预防糖尿病及其他并发症的问题。首先,为实现上述目的,本专利技术提出一种糖尿病分析方法,该方法包括步骤:设置样本范围,包括用户范围和数据维度;根据所设置的样本范围,获取相应的样本数据;对所述样本数据中的各个数据维度与糖尿病或并发症的关系进行关联分析,其中,将是否患糖尿病或并发症作为关联规则的右项集,其他数据维度作为左项集;及输出关联分析结果。可选地,该方法在之前还包括步骤:对所述样本数据进行预处理,包括缺失值处理和连续变量的离散化。可选地,所述用户范围包括数据来源及采集时间、城市、年龄、性别;所述数据维度包括人口属性、用户是否患有糖尿病及并发症、健康以及非健康因子。可选地,所述对所述样本数据中的各个数据维度与糖尿病或并发症的关系进行关联分析的步骤具体包括:从样本数据中获取各用户患病情况,包括糖尿病及其并发症;将是否患糖尿病或并发症作为关联规则的右项集,其他数据维度作为左项集进行关联分析;从结果中筛选出高提升度的规则,对应的左项集因子即为糖尿病或并发症的患病因子。可选地,所述对所述样本数据中的各个数据维度与糖尿病或并发症的关系进行关联分析的步骤还包括:按关联分析中找到的左项集因子对用户进行分类;对每一类用户进行进一步深入的分析,计算各类用户患糖尿病几率,产生各种并发症几率;比较各类用户的患病比例,找出糖尿病或并发症与不同的患病因子之间的病理关系,以及不同患病因子对于用户患上糖尿病或并发症的影响的强弱程度。可选地,所述关联分析结果包括关联项集以及相应的支持度、置信度、提升度。可选地,所述缺失值处理包括:默认将有缺失的数据进行丢弃,若要保留包含缺失的数据,则先对缺失值进行填充;所述缺失值的填充方式包括:人口属性和体检指标中涉及到的连续变量用均值填充;金融消费属性中涉及到的连续变量用0填充;各类疾病涉及到的缺失值用0填充;其他离散维度用-1填充。可选地,所述连续变量的离散化包括:对连续变量进行等频或等宽分箱。此外,为实现上述目的,本专利技术还提供一种应用服务器,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的糖尿病分析系统,所述糖尿病分析系统被所述处理器执行时实现如上述的糖尿病分析方法的步骤。进一步地,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有糖尿病分析系统,所述糖尿病分析系统可被至少一个处理器执行,以使所述至少一个处理器执行如上述的糖尿病分析方法的步骤。相较于现有技术,本专利技术所提出的糖尿病分析方法、应用服务器及计算机可读存储介质,可以利用大数据,基于庞大的用户样本,寻找样本的各个维度的特征及患病信息。通过关联分析的方法,研究各类不同的人群的各类患病之间的潜在关系。进而通过用户的患病情况得到各类不同用户患糖尿病的几率、糖尿病患者产生其他并发症的几率、以及糖尿病与其他影响因素之间的关系。最终帮助潜在糖尿病患者提早预防,并帮助糖尿病患者预防其他并发症的产生。附图说明图1是本专利技术应用服务器一可选的硬件架构的示意图;图2是本专利技术糖尿病分析系统第一实施例的程序模块示意图;图3是本专利技术糖尿病分析系统第二实施例的程序模块示意图;图4是本专利技术糖尿病分析方法第一实施例的流程示意图;图5是本专利技术糖尿病分析方法第二实施例的流程示意图;附图标记:应用服务器2存储器11处理器12网络接口13糖尿病分析系统200设置模块201获取模块202分析模块203输出模块204预处理模块205本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本专利技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。参阅图1所示,是本专利技术应用服务器2一可选的硬件架构的示意图。本实施例中,所述应用服务器2可包括,但不仅限于,可通过系统总线相互通信连接存储器11、处理器12、网络接口13。需要指出的是,图2仅示出了具有组件11-13的应用服务器2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,所述应用服务器2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备,该应用服务器2可以是独立的服务器,也可以是多个服务器所组成的服务器集群。所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述应用服务器2的内部存储单元,例如该应用服务器2的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述应用服务器2的外部存储设备,例如该应用服务器2上配备的插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器11还可以既包括所述应用服务器2的内部存储单元也包括其外部存储设备。本实施例中,所述存储器11通常用于存储安装于所述应用服务器2的操作系统和各类应用软件,例如糖尿病分析系统200的程序代码等。此外,所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。所述处理器12在一些实施例中可以是中央处理器(CentralProcessin本文档来自技高网...
糖尿病分析方法及应用服务器

【技术保护点】
一种糖尿病分析方法,应用于应用服务器,其特征在于,所述方法包括步骤:设置样本范围,包括用户范围和数据维度;根据所设置的样本范围,获取相应的样本数据;对所述样本数据中的各个数据维度与糖尿病或并发症的关系进行关联分析,其中,将是否患糖尿病或并发症作为关联规则的右项集,其他数据维度作为左项集;及输出关联分析结果。

【技术特征摘要】
1.一种糖尿病分析方法,应用于应用服务器,其特征在于,所述方法包括步骤:设置样本范围,包括用户范围和数据维度;根据所设置的样本范围,获取相应的样本数据;对所述样本数据中的各个数据维度与糖尿病或并发症的关系进行关联分析,其中,将是否患糖尿病或并发症作为关联规则的右项集,其他数据维度作为左项集;及输出关联分析结果。2.如权利要求1所述的糖尿病分析方法,其特征在于,该方法在进行所述关联分析之前还包括步骤:对所述样本数据进行预处理,包括缺失值处理和连续变量的离散化。3.如权利要求2所述的糖尿病分析方法,其特征在于,所述用户范围包括数据来源及采集时间、城市、年龄、性别;所述数据维度包括人口属性、用户是否患有糖尿病及并发症、健康以及非健康因子。4.如权利要求2所述的糖尿病分析方法,其特征在于,所述对所述样本数据中的各个数据维度与糖尿病或并发症的关系进行关联分析的步骤具体包括:从样本数据中获取各用户患病情况,包括糖尿病及其并发症;将是否患糖尿病或并发症作为关联规则的右项集,其他数据维度作为左项集进行关联分析;从结果中筛选出高提升度的规则,对应的左项集因子即为糖尿病或并发症的患病因子。5.如权利要求4所述的糖尿病分析方法,其特征在于,所述对所述样本数据中的各个数据维度与糖尿病或并发症的关系进行关联分析的步骤还包括:按关联分析中找到的左项集因子对用户进行分...

【专利技术属性】
技术研发人员:金晓辉李菲菲肖京徐亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1