当前位置: 首页 > 专利查询>淮阴工学院专利>正文

早期结直肠癌非结构化数据的深度学习分类方法技术

技术编号:22974704 阅读:32 留言:0更新日期:2019-12-31 23:25
本发明专利技术公开了一种早期结直肠癌非结构化数据的深度学习分类方法,包括:(1)提取样本的属性数据集X;(2)标准化处理得样本数据矩阵X’;(3)X’降维得矩阵X

Deep learning classification method for unstructured data of early colorectal cancer

【技术实现步骤摘要】
早期结直肠癌非结构化数据的深度学习分类方法
本专利技术涉及数据的深度学习与分类,具体涉及一种早期结直肠癌非结构化数据的深度学习分类方法。
技术介绍
目前医疗行业已融入更多人工智慧、传感技术等高科技,使医疗服务走向真正意义的智能化,推动医疗事业的繁荣发展。在中国新医改的大背景下,智慧医疗正在走进寻常百姓的生活。智慧健康医疗旨在医疗领域中应用人工智能技术实现智慧医疗,包括疾病风险预测、智能问诊、医疗影像分析、电子病历信息抽取、医疗健康数据分析、医疗保险评估、用药推荐等。结直肠癌(colorectalcancer,CRC)的发病率呈逐年上升趋势,已经跃居肿瘤死亡率的前3-5位,这越来越影响着人们的健康和生活质量。根据最新的数据,目前中国结直肠癌每年新发近40万例,死亡近20万人,死亡率达到了50%。必须要提的是,结直肠癌是近些年发病率逐年上升,在过去10年间新发病数和死亡数均翻了一番,且还在以年均4%-5%的速度递增。现有技术中对早期结直肠癌数据的分类是基于统计学进行分析,或针对特定样本进行特定分析,缺乏系统的预测机制。近年来本文档来自技高网...

【技术保护点】
1.一种早期结直肠癌非结构化数据的深度学习分类方法,其特征在于,包括以下步骤:/n(1)对样本数据进行预处理,提取样本的属性数据集X和样本对应的标签数据集Y;/n(2)对所述属性数据集X进行标准化处理,得到样本数据矩阵X’;/n(3)使用非负矩阵分解(NMF)对所述样本数据矩阵X’进行降维,得到降维矩阵X

【技术特征摘要】
1.一种早期结直肠癌非结构化数据的深度学习分类方法,其特征在于,包括以下步骤:
(1)对样本数据进行预处理,提取样本的属性数据集X和样本对应的标签数据集Y;
(2)对所述属性数据集X进行标准化处理,得到样本数据矩阵X’;
(3)使用非负矩阵分解(NMF)对所述样本数据矩阵X’进行降维,得到降维矩阵X1;
(4)对所述降维矩阵X1进行数据集的划分,得到初始训练集和测试集;
(5)基于深度置信网络DBN构建分类模型,利用所述训练集进行模型训练,提取样本隐藏的属性特征构建SVM输入训练集;
(6)使用支持向量机(SVM)算法得出所述测试集对应的分类结果;
(7)使用评价指标对分类结果进行评价。


2.根据权利要求1所述的深度学习分类方法,其特征在于,在所述步骤(2)中,标准化处理采用的标准化函数为:



其中,μ为样本每一列属性数据的均值,σ为样本每一列属性数据的标准差;X为样本的属性数据集,X’为对样本数据X进行标准化处理得到的样本数据矩阵。


3.根据权利要求1所述的深度学习分类方法,其特征在于,所述步骤(3)中,将所述样本数据矩阵X’当成是一个非负的特征矩阵,其中每行表示一个样本的特征向量;
非负矩阵分解的目标是求解两个非负矩阵因子W∈Pn×k,H∈Pk×m,(n+m)*k<nm,其中n为样本数据的数量,m为所有样本属性的个数;使得两者的乘积近似于原始矩阵,即样本的属性数据集X,即:
X≈WH
其中,k表示低维空间的维度,W表示低维空间向量,称为基矩阵;H表示重构原矩阵的向量乘积的系数,称为权重矩阵;
将此分解问题建模为Frobenius范数最优化问题:



其中,约束条件W≥0,H≥0表示矩阵H,V的所有元素均非负;
用系数矩阵W代替原始矩阵X,由原始矩阵X的维度降低到k维,得到降维矩阵X1。


4.根据权利要求1所述的深度学习分类方法,其特征在于,所述步骤(5)中,将降维后的样本的属性向量V作为DBN的输入;
在训练阶段,将可视层输入向量V传递到隐含层;否...

【专利技术属性】
技术研发人员:万晶晶陈伯伦于永涛马兴刚沈怡芸陈泰岳马甲林顾建祥
申请(专利权)人:淮阴工学院淮安市第二人民医院淮安仁慈医院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1