一种基于机器学习的软组织肉瘤等级判断方法技术

技术编号:27658459 阅读:27 留言:0更新日期:2021-03-12 14:23
本发明专利技术提供了一种基于机器学习的软组织肉瘤等级判断方法,所述方法为对软组织肉瘤影像进行典型特征提取,获得采样样本中所有病人的软组织肉瘤影像的典型特征,形成样本数据集,并对该样本数据集进行预处理,将经过预处理的样本数据集划分为测试集和训练集,基于生成的训练集,分别采用不同的机器学习算法构建机器学习模型并进行训练,将生成的测试集分别带入构建的多个机器学习模型中进行计算,可获得每种机器学习模型计算的预测值,计算预测值与真值之间的差异性,选取差异性最小的机器学习模型作为软组织肉瘤等级判断模型。可以将优秀医生、专家的经验积累下来,以便复制到其他小城市、小医院推广使用,提高诊断准确率,进而提升患者的治愈率。

【技术实现步骤摘要】
一种基于机器学习的软组织肉瘤等级判断方法
本专利技术属于医疗
,具体涉及一种基于机器学习的软组织肉瘤等级判断方法。
技术介绍
软组织肉瘤来源于脂肪、筋膜、肌肉、纤维、淋巴及血管,发病率约3/10万,其恶性程度高,可见于任何年龄段、任何部位,如果得不到及时诊断和治疗,不得不被迫截肢,已经成为人类健康的重要威胁。通过核磁共振MRI影像特征进行软组织肉瘤病变等级判断,是合理安排治疗方案的重要依据。然而根据核磁共振MRI影像特征实现软组织肉瘤等级判断,主要存在两方面问题:(1)肉瘤病变等级判断准确率,往往取决于诊断医生的能力和经验,能力越强、病例经验越多的医生,判断正确率越高,而这些医生往往只在北上广等大城市的一流医院工作,而小城市、小医院的医生无法准确判断肉瘤病变等级,也就无法合理安排治疗方案,延误病情;(2)核磁共振MRI影像可以提取出上千个维度的特征,如肉瘤直径、肉瘤图像局部纹理特征、灰度游程矩阵等,如何从这些特征中选取有限数量的特征,以便进行肉瘤等级的自动化判断,也是进行快速确诊的必要手段,然而现在还缺少有效手段实施。
技术实现思路
本专利技术提供了一种基于机器学习的软组织肉瘤等级判断方法,解决目前依靠医生能力和经验判断肉瘤病变等级,判断准确率不稳定的问题。本专利技术提供的一种基于机器学习的软组织肉瘤等级判断方法,所述方法依次包括如下步骤:S1、对软组织肉瘤影像进行典型特征提取,S2、获得采样样本中所有病人的软组织肉瘤影像的典型特征,形成样本数据集,并对该样本数据集进行预处理,S3、将经过预处理的样本数据集划分为测试集和训练集,S4、基于步骤3中生成的训练集,分别采用不同的机器学习算法构建机器学习模型并进行训练,S5、将步骤3中生成的测试集分别带入步骤4构建的多个机器学习模型中进行计算,可获得每种机器学习模型计算的预测值,计算预测值与真值之间的差异性,差异性越大,代表预测值与真值之间的差距越大,即预测的错误越多,选取差异性最小的机器学习模型作为软组织肉瘤等级判断模型。优选的,所述软组织肉瘤影像采用核磁共振MRI输出的软组织肉瘤影像。优选的,所述典型特征共取19个,将核磁共振MRI输出的软组织肉瘤影像,按照成像方式不同,分为T1加权成像和T2加权成像,所述19个典型特征分别为T1图像,小波-低低高频子带成像模式下,邻域灰度差矩阵的对比度特征;T1图像,5mm拉普拉斯算子三维成像模式下,灰度差异矩阵的依赖不均匀规范化特征;T1图像,原始成像模式下,灰度共生矩阵的逆方差特征;T1图像,15mm拉普拉斯算子三维成像模式下,一阶统计量的峰度特征;T1图像,小波-低高低频子带成像模式下,灰度差异矩阵的大依赖低灰度水平因子特征;T1图像,5mm拉普拉斯算子三维成像模式下,灰度共生矩阵的马修斯相关系数特征;T1图像,小波-高高低频子带成像模式下,灰度共生矩阵的马修斯相关系数特征;T1图像,小波-高低高频子带成像模式下,一阶统计量的中值特征;T2图像,15mm拉普拉斯算子三维成像模式下,一阶统计量的90分位数特征;T2图像,小波-高低高频子带成像模式下,灰度共生矩阵的聚类阴影特征;T2图像,小波-高高高频子带成像模式下,邻域灰度差矩阵的对比度特征;T2图像,原始成像模式下,形状的延长率特征;T2图像,小波-高高高频子带成像模式下,灰度区域大小矩阵的灰度级不均匀规范化特征;T2图像,小波-低低低频子带成像模式下,灰度共生矩阵的逆方差特征;T2图像,小波-高低高频子带成像模式下,灰度共生矩阵的逆方差特征;T2图像,原始成像模式下,灰度共生矩阵的逆方差特征;T2图像,小波-高低高频子带成像模式下,灰度游程矩阵的长游程高灰度因子特征;T2图像,小波-高高高频子带成像模式下,灰度游程矩阵的长游程高灰度因子特征;T2图像,小波-高高高频子带成像模式下,一阶统计量的中值特征。优选的,对样本数据集进行预处理的方法为对样本数据集进行归一化处理,公式如下:其中,为样本数据集,为样本数据集中最小数据,为样本数据集中最大数据,为归一化后的数据。优选的,所述训练集的数量为测试集数量为N为采样样本的总数量。优选的,将经过预处理的样本数据集划分为测试集和训练集之后,并且基于生成的训练集,分别采用不同的机器学习算法构建机器学习模型并进行训练之前,需对训练集按照不同等级软组织肉瘤患者数量进行均衡化处理,所述均衡化处理采用人工少数类过采样法,均衡原则为:NGm代表第m个软组织肉瘤病变等级对应的病人样本数,m通常取值为{1,2},1代表良性、2代表恶级。优选的,步骤4中,采用决策树、随机森林、支持向量机、BP神经网络四种机器学习算法构建机器学习模型(MCART,MRF,MSVM,MANN)进行训练。优选的,将步骤3中生成的测试集分别带入构建的四个机器学习模型(MCART,MRF,MSVM,MANN)中进行计算,可获得四种模型计算的预测值:和所述预测值与真值之间的差异性,即参数d,计算方式如下式:针对全部模型的参数dCART、dRF、dSVM和dANN,选择其中的最小值min{dCART,dRF,dSVM,dANN}对应的模型即为本专利技术的软组织肉瘤等级判别模型。本专利技术的有益效果:本专利技术提出了一种机器学习的软组织肉瘤等级判断方法,首先,提出软组织肉瘤的核磁共振MRI影像中典型特征的选择思路;其次,利用选取的典型特征,进行样本数据的预处理;再次,利用随机森林、逻辑回归、BP神经网络等机器学习算法,开展肉瘤等级诊断;最后,根据各学习算法的实施结果,确定具体判断方法,可以将优秀医生、专家的经验积累下来,复制到其他小城市、小医院推广使用,提高判断准确率,进而提升患者的治愈率。附图说明图1为基于机器学习的软组织肉瘤等级判断方法的流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本专利技术,不能理解为对本专利技术具体保护范围的限定。实施例参照图1,本实施例的基于机器学习的软组织肉瘤等级判断方法依次包括如下步骤:S1、对软组织肉瘤影像进行典型特征提取;S2、获得采样样本中所有病人的软组织肉瘤影像的典型特征,形成样本数据集,并对该样本数据集进行预处理;S3、将经过预处理的样本数据集划分为测试集和训练集,S4、基于步骤3中生成的训练集,分别采用不同的机器学习算法构建机器学习模型并进行训练,S5、将步骤3中生成的测试集分别带入步骤4构建的多个机器学习模型中进行计算,可获得每种机器学习模型计算的预测值,建立预测值与真值之间的差异性,差异性越大,代表预测值与真值之间的差距越大,即预测的错误越多,选取差异性最小的机器学习模型作为软组织肉瘤等级判断模型。具体的,步骤1是基于软组织肉瘤核磁共振MRI影像进行典型特征提取的,按照成像方式不同,可以分为T1加本文档来自技高网...

【技术保护点】
1.一种基于机器学习的软组织肉瘤等级判断方法,其特征在于,所述方法依次包括如下步骤:/nS1、对软组织肉瘤影像进行典型特征提取,/nS2、获得采样样本中所有病人的软组织肉瘤影像的典型特征,形成样本数据集,并对该样本数据集进行预处理,/nS3、将经过预处理的样本数据集划分为测试集和训练集,/nS4、基于步骤3中生成的训练集,分别采用不同的机器学习算法构建机器学习模型并进行训练,/nS5、将步骤3中生成的测试集分别带入步骤4构建的多个机器学习模型中进行计算,可获得每种机器学习模型计算的预测值,计算预测值与真值之间的差异性,差异性越大,代表预测值与真值之间的差距越大,即预测的错误越多,选取差异性最小的机器学习模型作为软组织肉瘤等级判断模型。/n

【技术特征摘要】
1.一种基于机器学习的软组织肉瘤等级判断方法,其特征在于,所述方法依次包括如下步骤:
S1、对软组织肉瘤影像进行典型特征提取,
S2、获得采样样本中所有病人的软组织肉瘤影像的典型特征,形成样本数据集,并对该样本数据集进行预处理,
S3、将经过预处理的样本数据集划分为测试集和训练集,
S4、基于步骤3中生成的训练集,分别采用不同的机器学习算法构建机器学习模型并进行训练,
S5、将步骤3中生成的测试集分别带入步骤4构建的多个机器学习模型中进行计算,可获得每种机器学习模型计算的预测值,计算预测值与真值之间的差异性,差异性越大,代表预测值与真值之间的差距越大,即预测的错误越多,选取差异性最小的机器学习模型作为软组织肉瘤等级判断模型。


2.根据权利要求1所述的基于机器学习的软组织肉瘤等级判断方法,其特征在于:所述软组织肉瘤影像采用核磁共振MRI输出的软组织肉瘤影像。


3.根据权利要求2所述的基于机器学习的软组织肉瘤等级判断方法,其特征在于:所述典型特征共取19个,将核磁共振MRI输出的软组织肉瘤影像,按照成像方式不同,分为T1加权成像和T2加权成像,所述19个典型特征分别为T1图像,小波-低低高频子带成像模式下,邻域灰度差矩阵的对比度特征;T1图像,5mm拉普拉斯算子三维成像模式下,灰度差异矩阵的依赖不均匀规范化特征;T1图像,原始成像模式下,灰度共生矩阵的逆方差特征;T1图像,15mm拉普拉斯算子三维成像模式下,一阶统计量的峰度特征;T1图像,小波-低高低频子带成像模式下,灰度差异矩阵的大依赖低灰度水平因子特征;T1图像,5mm拉普拉斯算子三维成像模式下,灰度共生矩阵的马修斯相关系数特征;T1图像,小波-高高低频子带成像模式下,灰度共生矩阵的马修斯相关系数特征;T1图像,小波-高低高频子带成像模式下,一阶统计量的中值特征;T2图像,15mm拉普拉斯算子三维成像模式下,一阶统计量的90分位数特征;T2图像,小波-高低高频子带成像模式下,灰度共生矩阵的聚类阴影特征;T2图像,小波-高高高频子带成像模式下,邻域灰度差矩阵的对比度特征;T2图像,原始成像模式下,形状的延长率特征;T2图像,小波-高高高频子带成像模式下,灰度区域大小矩阵的灰度级不均匀规范化特征;T2图像,小波-低低低频子带成像模式下,灰度共生矩阵的逆方差特征;...

【专利技术属性】
技术研发人员:郝大鹏王鹤翔杨海强
申请(专利权)人:青岛大学附属医院青岛大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1