一种高血压病人随访推荐的方法技术

技术编号:17542851 阅读:89 留言:0更新日期:2018-03-24 21:18
一种高血压病人随访推荐的方法,包括:提取并关联数据库中高血压病人的个人健康档案和随访后产生的潜在性血压影响因子;将获取的数据进行清洗得到有效数据和现有特征变量;根据有效数据进行特征构建得到构建特征变量;采用LMM模型对现有特征变量和构建特征变量进行筛选获得显著特征变量;将有效数据和显著特征变量代入多层逻辑回归拟合函数进行拟合得到多层逻辑回归模型;将患者最近一次的测量数据和每日更新的数据作为预测值代入多层逻辑回归模型,计算患者血压超过正常值的概率;根据获取的数据、血压超过正常值的概率、以及更新的数据,对需要随访的患者进行推荐。

A method of follow-up recommendation for patients with hypertension

【技术实现步骤摘要】
一种高血压病人随访推荐的方法
本专利技术属于医疗
,涉及一种高血压病人随访推荐的方法。
技术介绍
近几年来,高血压病患者人数在全球范围内不断攀升,根据国际健康组织的不完全统计,在2016年初,全球成年人中高血压患者占据20%以上。目前预估我国高血压患者人数超过2亿且病人对自身疾病的知晓率仅为30%,控制率仅为6%,且高血压病又往往伴随着中风、心力衰竭、眼部损害等诸多并发症,给人民的生活和健康造成极其严重的负面影响。目前国内针对高血压病人的疾病控制主要由社区、街道卫生院工作人员对高血压病人进行随访,通过药品和医嘱控制病情,并搜集病人生理、病理以及生活习惯等数据。但医疗资源的不均衡分布严重阻碍了高血压病人病情控制,其不平衡性主要体现在(1)时间:工作人员会对上次随访,血压超过阈值的病人在近期再度随访,一般间隔在15天以内,而未超过阈值的随访间隔则长至三个月或以上,随访时发现很大一部分病人的血压已严重超标且伴随其它病症的恶化现象。(2)空间:城乡医疗卫生资源的差距比较大,城市人口平均拥有的医疗卫生资源是农村人口的2.5倍以上,比如,占全国总人口近70%的农村拥有全国医疗卫生资源的30%,而占全国总人口30%的城市却占有全国医疗卫生资源的70%。所以提高基层工作人员的随访效率和医疗资源的利用率是慢性病控制的关键。准确地预测高血压患者血压的变化情况能够更有针对性地对患者进行随访,目前已有的血压预测技术中,主要通过神经网络模型和深度学习中的循环神经网络模型对高血压的发病进行预测,但这些技术在应用方面存在几点不足。(1)CN201510028877.6一种利用神经网络的高血压预测方法中,忽略了同一个体在不同时间维度下表现的自相关性,因此仅适用于对未确诊为高血压病的人群患高血压概率的预测,并起到预防作用,而不能准确预测高血压患者的血压变化情况。(2)CN201611027689.2基于循环神经网络构建预测模型的方法中涵盖了病人个体差异和测量水平差异两大方面,能够较为准确地监测不同个体的血压随时间变化情况并对下一个时间节点的血压进行预测,然而此种方法大都依靠可穿戴设备对数据进行采集,采集的数据必须是标准的时间序列结构(时间起始、间隔均相同),若数据因病人脱卸设备或设备损坏等原因未能准确及时地上传会影响预测结果,因此具有成本高、灵活性低、不可控性强的缺陷。
技术实现思路
本专利技术提出了一种可行性强、可控性强、预测个性化、灵活性强的高血压病人随访推荐的方法。本专利技术采用的技术方案是:一种高血压病人随访推荐的方法,其特征在于:包括:提取并关联数据库中高血压病人的个人健康档案和随访后产生的潜在性血压影响因子;将获取的数据进行清洗得到有效数据和现有特征变量;根据有效数据进行特征构建得到构建特征变量;采用LMM模型对现有特征变量和构建特征变量进行筛选获得显著特征变量;将有效数据和显著特征变量代入多层逻辑回归拟合函数进行拟合得到多层逻辑回归模型;将患者最近一次的测量数据和每日更新的数据作为预测值代入多层逻辑回归模型,计算患者血压超过正常值的概率;根据获取的数据、血压超过正常值的概率、以及更新的数据,对需要随访的患者进行推荐。进一步,数据清洗步骤包括:(1)变量转化:将数据库中的潜在性血压影响因子分别转化成对应的数值型变量、定类变量、定序变量和日期型变量;(2)错误录入值和极端值过滤:针对类型变量直接移除类别频数小于N的行,针对连续型变量,观察其分布情况后根据高斯概率密度函数:其中j表示需要对变量进行过滤的数值型变量,xj表示变量的实际值,uj表示各变量的平均值,σj为各变量的方差;移除Xu>μj-tσj,和Xl<μj+tσj的行,其中Xu,Xl分别表示计算出的保留的上下区间,t表示方差的倍数,通过t值可计算保留数据的百分比;(3)缺失值处理:根据获取的数据,直接移除一条数据中同时丢失M个以上变量的行;对于同时缺失在M个以下的行数据,使用KNN算法对缺失数据进行填充,根据欧几里得距离,其中xg,yg分别表示两个实例间各个变量的实际值:选取k个相似的临近单位,针对类型变量用最常出现的值填充,连续型变量则用中位数填充;(4)时间过滤:过滤不符合预期的时间范围,且为了突出个体间的随机效应,需要选择固定时间范围内随访次数较多(j次)的个体。进一步,构建特征变量包括:(1)BMI(身体质量指数)=w/h^2,其中w表示患者的体重,h表示患者身高;(2)提取随访日期中的月份L作为季节性参考;(3)计算两次随访的时间间隔,计算方式为:TP=Diff(CurrentDate-LastDate)其中CurrentDate表示此次随访时间,在模型训练时为当前的随访日期,用于预测时为当前的系统时间,LastDate表示上次随访的日期,Diff是计算日期间间隔天数的一种表达形式;(4)将病人编号,按日期从小到大的顺序排列,统计随访次数,每行的随访次数N的计算方式为:N=LastN+1其中,LastN等于上次随访的次数,每个病人的第一条数据N=1;(5)患病天数的计算方式为:ND=CurrentDate-FirstDate其中ND表示患病的总天数估计,为当前随访日期减去第一次随访的日期FisrtDate,用于预测时,CurrentDate为当前的系统时间;(6)计算血压稳定性因子,选择方差和偏度:其中,StandardDeviation为偏差,Skewness为偏度,LastDate血压的实际值,μblood为血压的平均值,σblood为血压的方差,T为实例的个数。进一步,LMM模型的表达式为:Yblood=Xcβ+ZcBc+εc该模型包含了固定效应和随机效应,其中Xc表示A*p个固定效应矩阵,A表示实例个数,p表示维度,β表示p维未知的固定效应斜率,同理,Zc和Bc反映了不同个体层面上带来的随机影响。进一步,LMM模型结合MarginalR-Square模型进行变量筛选。进一步,多层逻辑回归拟合模型拟合步骤包括:结合逻辑回归模型和多层线性模型推导多层逻辑回归的拟合函数:水平1:Yij=ρ0j+ρ1jXij+εij水平2:ρ0j=γ00+γ01Wj+θ0jρ1j=γ10+γ11Wj+θ1j其中水平1为重复测量的表达式,ρ表示水平1即整体水平上的拟合截距与斜率,水平2反应个体差异,Yij表示高血压因变量,Xij为每个人每次血压测量的预测变量,Wj表示第二水平上个体的预测变量,γ的值为拟合的斜率和截距参数,εij为拟合误差,θ0j和θ1j分别表示截距和斜率在水平2上的差异,上述公式组合后得:Yij=γ00+γ01Xij+γ01XijWj+θ0j+θ1jXij+εij再结合逻辑回归的连接表达式,将有效数据和显著特征变量代入拟合。进一步,需要进行随访推荐的患者包括:(1)超过a个月未被随访的患者;(2)被确诊为高血压的患者在前期进行定期定次随访;(3)随访阈值在概率c以上且g天内未被随访过的患者。本专利技术的有益效果:(1)可行性强,该随访推荐模型主要基于随访的历史数据对患者血压变化情况进行预测,成本低,速度快。(2)可控性强,随访推荐系统中有模块分成智能推荐和硬性约束两个模块,保障了病情的可控性。(3)预测个性化,对每个不同的个体结合本文档来自技高网
...
一种高血压病人随访推荐的方法

【技术保护点】
一种高血压病人随访推荐的方法,其特征在于:包括:提取并关联数据库中高血压病人的个人健康档案和随访后产生的潜在性血压影响因子;将获取的数据进行清洗得到有效数据和现有特征变量;根据有效数据进行特征构建得到构建特征变量;采用LMM模型对现有特征变量和构建特征变量进行筛选获得显著特征变量;将有效数据和显著特征变量代入多层逻辑回归拟合函数进行拟合得到多层逻辑回归模型;将患者最近一次的测量数据和每日更新的数据作为预测值代入多层逻辑回归模型,计算患者血压超过正常值的概率;根据获取的数据、血压超过正常值的概率、以及更新的数据,对需要随访的患者进行推荐。

【技术特征摘要】
1.一种高血压病人随访推荐的方法,其特征在于:包括:提取并关联数据库中高血压病人的个人健康档案和随访后产生的潜在性血压影响因子;将获取的数据进行清洗得到有效数据和现有特征变量;根据有效数据进行特征构建得到构建特征变量;采用LMM模型对现有特征变量和构建特征变量进行筛选获得显著特征变量;将有效数据和显著特征变量代入多层逻辑回归拟合函数进行拟合得到多层逻辑回归模型;将患者最近一次的测量数据和每日更新的数据作为预测值代入多层逻辑回归模型,计算患者血压超过正常值的概率;根据获取的数据、血压超过正常值的概率、以及更新的数据,对需要随访的患者进行推荐。2.根据权利要求1所述的一种高血压病人随访推荐的方法,其特征在于:数据清洗步骤包括:(1)变量转化:将数据库中的潜在性血压影响因子分别转化成对应的数值型变量、定类变量、定序变量和日期型变量;(2)错误录入值和极端值过滤:针对类型变量直接移除类别频数小于N的行,针对连续型变量,观察其分布情况后根据高斯概率密度函数:其中j表示需要对变量进行过滤的数值型变量,xj表示变量的实际值,μj表示各变量的平均值,σj为各变量的方差;移除Xu>μj-tσj,和Xl<μj+tσj的行,其中Xu,Xl分别表示计算出的保留的上下区间,t表示方差的倍数,通过t值可计算保留数据的百分比;(3)缺失值处理:根据获取的数据,直接移除一条数据中同时丢失M个以上变量的行;对于同时缺失在M个以下的行数据,使用KNN算法对缺失数据进行填充,根据欧几里得距离,其中xg,yg分别表示两个实例间各个变量的实际值:选取k个相似的临近单位,针对类型变量用最常出现的值填充,连续型变量则用中位数填充;(4)时间过滤:过滤不符合预期的时间范围,且为了突出个体间的随机效应,需要选择固定时间范围内随访次数较多的个体。3.根据权利要求1所述的一种高血压病人随访推荐的方法,其特征在于:构建特征变量包括:(1)BMI=w/h^2,其中w表示患者的体重,h表示患者身高;(2)提取随访日期中的月份L作为季节性参考;(3)计算两次随访的时间间隔,计算方式为:TP=Diff(CurrentDate-LastDate)其中CurrentDate表示此次随访时间,在模型训练时为当前的随访日期,用于预测时为当前的系统时间,LastDate表示上次随访的日期,Diff是计算日期间间隔天数的一种表达形式...

【专利技术属性】
技术研发人员:涂昶陈涛李建元王开红
申请(专利权)人:银江股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1