医学药物领域高维数据变量选择与预测方法及装置制造方法及图纸

技术编号:20366811 阅读:93 留言:0更新日期:2019-02-16 18:20
本发明专利技术提供了一种医学药物领域高维数据变量选择与预测方法及装置,可以提前预知患者出现严重并发症的风险如何,在肝移植前给予适当处理,能够降低出现严重并发症的风险。一种医学药物领域高维数据变量选择与预测方法包括:建立带有弹性网约束的Expectile回归模型,得到ER‑EN模型;对所述ER‑EN模型进行求解;采用十折交叉验证方法对所述ER‑EN模型进行参数选择;验证所述ER‑EN模型的预测能力。本发明专利技术实施例中通过建立的带有弹性网约束的Expectile回归模型(ER‑EN模型),调节调整参数可以控制变量选择压缩程度,具有较大的灵活性和实用性。并且,ER‑EN模型能够对医学药物领域高维数据进行变量选择与准确预测,提供更多有效信息进行科学决策,降低了误判的风险。

【技术实现步骤摘要】
医学药物领域高维数据变量选择与预测方法及装置
本专利技术涉及数据处理
,尤其涉及一种医学药物领域高维数据变量选择与预测方法及装置。
技术介绍
在医学领域中,药物高维数据变量选择具有十分重要的意义,其中高维数据是指变量数目大于或远远大于样本数目的数据集。因此,高维数据中变量选择和预测将直接关系到病理分析结果,以通过在模型中施加权重约束,将无关变量权重约束到0,从而筛选出权重较大的变量进行分析。随着大数据分析方法在医药领域中将发挥越来越重要的作用,基于现代生物医学技术的个性化医疗,即精准医学,是未来医学的发展方向。在实际应用中,回归分析为探寻病症与其影响因素之间关系提供了有效工具。目前,最为常用的三种回归方法,主要有:1)基于平方损失的均值回归OLS;2)基于非对称绝对值损失的分位数回归;3)基于非对称平方损失的Expectile回归。比较而言,第三种Expectile回归较前两种回归方法优势明显,不仅可以使用标准的梯度优化算法进行求解,具有计算上的优势;而且可以完整刻画响应变量条件分布特征,提供更多有用信息,便于医药领域的科学决策。如何获取、分类、存储医药大数据,如何挖掘医药大数本文档来自技高网...

【技术保护点】
1.一种医学药物领域高维数据变量选择与预测方法,其特征在于,包括:建立带有弹性网约束的Expectile回归模型,得到ER‑EN(Elastic‑Net Penalized Expectile Regression)模型;对所述ER‑EN模型进行求解;采用十折交叉验证方法对所述ER‑EN模型进行参数选择;验证所述ER‑EN模型的预测能力。

【技术特征摘要】
1.一种医学药物领域高维数据变量选择与预测方法,其特征在于,包括:建立带有弹性网约束的Expectile回归模型,得到ER-EN(Elastic-NetPenalizedExpectileRegression)模型;对所述ER-EN模型进行求解;采用十折交叉验证方法对所述ER-EN模型进行参数选择;验证所述ER-EN模型的预测能力。2.根据权利要求1所述的医学药物领域高维数据变量选择与预测方法,其特征在于,所述ER-EN模型为:其中,l(u)≡ρθ(u)=u2·(θ-I(u<0))表示非对称平方损失,θ∈(0,1)为损失函数不对称区间;(yi,x1,i,x2,i,…,xp,i)表示观测值;表示Expectile回归损失函数;β(θ)≡[β1(θ),β2(θ),…,βp(θ)]T;γ表示调整参数。3.根据权利要求1所述的医学药物领域高维数据变量选择与预测方法,其特征在于,对所述ER-EN模型进行求解包括:设置Karush-Kuhn-Tucker条件,以得到给定范围内的全局最小值;采用半平滑牛顿坐标下降算法SNCD对所述ER-EN模型的解。4.根据权利要求3所述的医学药物领域高维数据变量选择与预测方法,其特征在于,KKT条件方程为:式中,S是软阈值算子;S(z)=sgn(z)(|z|-1)+,当且仅当u=S(u+s);ρ′θ(u)表示ρθ(·)的导数;对于β0,i=1,…,N;KKT条件为对于(βj,sj),KKT条件为5.根据权利要求3所述的医学药物领域高维数据变量选择与预...

【专利技术属性】
技术研发人员:丁晓涵许启发蒋翠侠
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1