一种结合深度网络特征和机器学习模型的乳腺癌数据分类方法技术

技术编号：23853684 阅读：48 留言：0更新日期：2020-04-18 09:57

本发明专利技术公开了一种结合深度网络特征和机器学习模型的乳腺癌数据分类方法，属于大数据技术领域，包括建立影像采集服务器、客户端和数据分类服务器，勾画和处理肿瘤区域图片，得到分类图片的数据集合，提取带有肿瘤的MRI图层的图像特征，模型构建模块采用Tensorflow和Keras提供的网络模型作为基准模型，建立训练模型，采用SVM径向基核进行分类模型训练，解决了对肿瘤图片进行数据分类的技术问题，本发明专利技术结合了迁移学习、深度学习特征提取、影像组学、包装法特征选择、机器学习模型训练等方法，实现了乳腺癌数据的实时分类，提高了分类准确度，本发明专利技术利用了深度学习提取的高维度抽象特征，也避免了小数据集在深度学习上的过拟合问题。

A breast cancer data classification method based on deep network features and machine learning model

全部详细技术资料下载

【技术实现步骤摘要】
一种结合深度网络特征和机器学习模型的乳腺癌数据分类方法
本专利技术属于大数据
，尤其涉及一种结合深度网络特征和机器学习模型的乳腺癌数据分类方法。
技术介绍
目前医疗影像技术已经被广泛的应用在肿瘤的临床中，医疗影像技术是以图片数据的方式展示肿瘤，医生在分析肿瘤数据时往往带有很强的经验性和主观性，不能准确的分析出癌症的相关数据。目前对肿瘤的影像数据的分析均采用小数据集进行分析，在深度学习上会出现过拟合问题。
技术实现思路
本专利技术的目的是提供一种结合深度网络特征和机器学习模型的乳腺癌数据分类方法，解决了对肿瘤图片进行数据分类的技术问题。为实现上述目的，本专利技术采用如下技术方案：一种结合深度网络特征和机器学习模型的乳腺癌数据分类方法，包括如下步骤：步骤1：建立影像采集服务器、客户端和数据分类服务器，影像图片采集服务器、客户端和数据分类服务器均通过互联网相互通信；在数据分类服务器中建立图片处理模块、特征提取模块和模型构建模块；步骤2：影像采集服务器采集肿瘤图片，并将肿瘤图片发送给客户端；步骤3：医疗人员通过客户端编辑肿瘤图片，在肿瘤图片上勾画出肿瘤区域，生成肿瘤区域图片；客户端将肿瘤图片和肿瘤区域图片一起发送给数据分类服务器；步骤4：数据分类服务器接收到肿瘤图片和肿瘤区域图片后，图片处理模块设定一个虚拟矩形，找出肿瘤区域图片的中心点，以该中心点作为虚拟矩形的中心，根据虚拟矩形的边界对肿瘤区域图片进行截取，得到分类图片...

【技术保护点】
1.一种结合深度网络特征和机器学习模型的乳腺癌数据分类方法，其特征在于：包括如下步骤：/n步骤1：建立影像采集服务器、客户端和数据分类服务器，影像图片采集服务器、客户端和数据分类服务器均通过互联网相互通信；/n在数据分类服务器中建立图片处理模块、特征提取模块和模型构建模块；/n步骤2：影像采集服务器采集肿瘤图片，并将肿瘤图片发送给客户端；/n步骤3：医疗人员通过客户端编辑肿瘤图片，在肿瘤图片上勾画出肿瘤区域，生成肿瘤区域图片；/n客户端将肿瘤图片和肿瘤区域图片一起发送给数据分类服务器；/n步骤4：数据分类服务器接收到肿瘤图片和肿瘤区域图片后，图片处理模块设定一个虚拟矩形，找出肿瘤区域图片的中心点，以该中心点作为虚拟矩形的中心，根据虚拟矩形的边界对肿瘤区域图片进行截取，得到分类图片；/n步骤5：按照步骤2到步骤4的方法，对多个肿瘤图片进行处理，得到分类图片的数据集合；/n按照训练集70％、测试集30％的规则，利用分层抽样的方法将分类图片的数据集合划分为分类训练集和分类测试集；/n对训练组数据进行数据集增广操作，得到扩大版训练集；/n步骤6：特征提取模块调取扩大版训练集，从扩大版训练集中的...

【技术特征摘要】
1.一种结合深度网络特征和机器学习模型的乳腺癌数据分类方法，其特征在于：包括如下步骤：
步骤1：建立影像采集服务器、客户端和数据分类服务器，影像图片采集服务器、客户端和数据分类服务器均通过互联网相互通信；
在数据分类服务器中建立图片处理模块、特征提取模块和模型构建模块；
步骤2：影像采集服务器采集肿瘤图片，并将肿瘤图片发送给客户端；
步骤3：医疗人员通过客户端编辑肿瘤图片，在肿瘤图片上勾画出肿瘤区域，生成肿瘤区域图片；
客户端将肿瘤图片和肿瘤区域图片一起发送给数据分类服务器；
步骤4：数据分类服务器接收到肿瘤图片和肿瘤区域图片后，图片处理模块设定一个虚拟矩形，找出肿瘤区域图片的中心点，以该中心点作为虚拟矩形的中心，根据虚拟矩形的边界对肿瘤区域图片进行截取，得到分类图片；
步骤5：按照步骤2到步骤4的方法，对多个肿瘤图片进行处理，得到分类图片的数据集合；
按照训练集70％、测试集30％的规则，利用分层抽样的方法将分类图片的数据集合划分为分类训练集和分类测试集；
对训练组数据进行数据集增广操作，得到扩大版训练集；
步骤6：特征提取模块调取扩大版训练集，从扩大版训练集中的分类图片中提取带有肿瘤的MRI图层的图像特征；
步骤7：模型构建模块采用Tensorflow和Keras提供的网络模型作为基准模型，建立训练模型，其步骤如下：
步骤A1：载入基准模型的初始参数，去掉基准模型最后一层全连接层，加入初始化参数为0的新的全连接层，全连接层使用Sigmoid激活函数，输出维度为2，输出值作为预测概率；
步骤A2：将扩大版训练集作为模型训练数据，将其中的分类图片复制为三通道图像，采用5折交叉验证进行模型训练，建立训练模型；
步骤A4：将分类测试集放入训练模型中进行测试，得到模型评价，模型评价的标准为准确率和AUC；
步骤8：选择基础模型中的隐藏层最后一层输出的特征图作为深度学习特征，将二维矩阵展平成一维向量，向量维度统一使用64维，大于64维的采用PCA算法进行降维，得到39维影像组学特征与64维深度学习特征；...

【专利技术属性】
技术研发人员：翟运开，赵杰，石金铭，甘富文，陈昊天，陈保站，李明原，曹明波，
申请(专利权)人：郑州大学第一附属医院，
类型：发明
国别省市：河南;41

全部详细技术资料下载我是这个专利的主人