基于机器学习的肝癌分类方法和装置制造方法及图纸

技术编号:38326162 阅读:20 留言:0更新日期:2023-07-29 09:08
本发明专利技术提供一种基于机器学习的肝癌分类处理方法和装置。该方法中,分别将获取到的待分类的医学影像输入第一分类模型得到第一分类结果,并将病理图像输入第二分类模型得到第二分类结果,第一分类模型是基于加权Fisher构造的神经网络模型训练得到的模型,第二分类模型是基于在VGG模型中增加BN算法之后进行训练得到的对肝癌病理图像进行分类的模型,根据第一分类结果和第二分结果确定最终的肝癌分类结果。通过在机器学习的过程中使用Fisher准则,确保样本实际值与样本标签误差尽可能小,并且在对病理图像的分类模型训练过程中,增加BN算法对输入数据做批量标准化处理,从而优化最终的分类结果,提高分类准确度。提高分类准确度。提高分类准确度。

【技术实现步骤摘要】
基于机器学习的肝癌分类方法和装置


[0001]本专利技术涉及人工智能技术,尤其涉及一种基于机器学习的肝癌分类处理方法和装置。

技术介绍

[0002]根据最新统计数据表明,全球每5人中就会有1人在一生之中罹患癌症,尤其是肝癌,由于其高发病率和高死亡率而成为全世界癌症死亡的主要原因之一,早期肝癌的检测与治疗是有效降低肝癌死亡率的重要途径。
[0003]目前,对于肝癌的诊断方式主要是以肿瘤的医学影像分析的方式来确定,具体的,目前的,肿瘤医学影像是癌症诊断的基础,可以采用X射线、电子计算机断层扫描(Computed Tomography,CT)、磁共振、超声波等手段获取相应的医学影像,可以通过机器学习的方式训练对不同类型和阶段的肝癌进行识别的模型,然后通过模型识别的方式对拍摄得到的肝脏的医学影像进行识别,确定具体的癌症的类型和阶段。
[0004]然而,由于目前的肝脏上产生的各种肿瘤病变的形状,大小,边界区别都非常大,并且肝脏上肿瘤的大小多样,结构位置复杂,导致目前采用的简单的机器学习的方式进行识别,可能导致误诊或者分类不准确,从而导致治疗效果不佳。

技术实现思路

[0005]本专利技术实施例提供一种基于机器学习的肝癌分类处理方法和装置,用于解决目前采用的简单的机器学习的方式进行识别,可能导致误诊或者分类不准确,从而导致治疗效果不佳的问题。
[0006]本专利技术实施例的第一方面,提供一种基于机器学习的肝癌分类处理方法,其特征在于,包括:
[0007]获取待进行肝癌分类检测的医学影像和病理图像,所述医学影像为针对肝脏部分扫描得到的增强CT图像或者核磁共振图像;
[0008]将所述医学影像输入第一分类模型得到第一分类结果,并将所述病理图像输入第二分类模型得到第二分类结果;其中,所述第一分类模型是基于加权Fisher构造的神经网络模型训练得到的对肝癌进行识别分类的模型,所述第二分类模型是基于在VGG模型中增加BN算法之后进行训练得到的对肝癌病理图像进行分类的模型;
[0009]根据所述第一分类结果和所述第二分结果确定最终的肝癌分类结果。
[0010]在一种具体实现方式中,所述根据所述第一分类结果和所述第二分结果确定最终的肝癌分类结果,包括;
[0011]若所述第一分类结果和所述第二分类结果相同,则将其中任一结果确定为最终的肝癌分类结果;
[0012]若所述第一分类结果和所述第二分类结果不同,则将所述病理图像通过随机裁剪和随机颜色失真的数据方法进行扩充,得到增强处理后的病理图像;
[0013]将所述增强处理后的病理图像输入所述第二分类模型中进行处理,得到最终的肝癌分类结果。
[0014]在一种具体实现方式中,所述方法还包括:
[0015]将获取到的医学影像集合中的影像分为训练集和验证集,所述医学影像集合中包括多个已经标定的正常肝脏的医学影像以及每个分类的肝癌对应的多个医学影像;
[0016]针对所述训练集中的医学影像,将医学影像输入预先构造的神经网络模型的卷积层中进行卷积处理,得到第一卷积特征集合;
[0017]将所述第一卷积特征集合进行均值采样的方法进行处理,得到第二卷积特征集合;
[0018]将所述第二卷积特征集合输入所述神经网络模型的全连接层进行处理,最终输出所述神经网络模型的预测结果;
[0019]运用加权Fish
er
准则对应的函数作为损失函数,计算医学影像的标定结果和所述预测结果之间的损失值,并基于所述损失值经过反向传播传递残差修正模型参数,重复前述步骤直至所述损失值收敛,采用所述验证集对训练的模型进行验证,得到所述第一分类模型。
[0020]在一种具体实现方式中,初始构造的神经网络模型的卷积层的公式为:
[0021][0022]其中,M
e
表示输入的图像集合,表示神经网络模型卷积中的第1层中的第e个特征图像,K
l
表示第1层的卷积核,*表示卷积运算,表示与第l

1层第f个特征图像进行相连的滤波器,表示偏置,f(
·
)表示神经元非线性激活函数。
[0023]在一种具体实现方式中,所述加权Fisher准则对应的损失函数为:
[0024]Y=Y(W,b)

αY
B
+βY
w
;其中,α和β为常数系数,取值范围在0

1之间,Y
B
表示类间距离的度量函数,Y
w
表示类内距离度量的函数;
[0025][0026][0027]其中,Δ
ij
表示第i类样本和第j类样本之间的马氏距离,ω(Δ
ij
)为权值函数,n表示第i类样本的总数,m表示第j类样本的总数,W,b分别表示所述神经网络模型中的卷积核的权值和偏置,x表示具体的样本图像。
[0028]在一种具体实现方式中,所述方法还包括:
[0029]将获取到的肝脏病理图像集合中的图像分为训练集和验证集,所述肝脏病理图像集合中包括已经标注了正常肝脏,肝细胞癌,胆管细胞癌和混合癌的病理在多种放大倍数下的多个病理图像,所述多种放大倍数包括40倍,100倍,200倍和400倍;
[0030]在VGG模型的卷积层的Relu函数之前加入BN算法,构建出新的VGG模型,所述新的VGG模型包含16个卷积层,3个全连接层和1个输出层;所述BN算法用于对Relu函数的输入数据进行标准化处理;
[0031]基于所述训练集和所述验证集对所述新的VGG模型进行训练和验证,得到第二分类模型。
[0032]在一种具体实现方式中,所述在VGG模型的卷积层的Relu函数之前加入BN算法,包括:
[0033]在VGG模型的卷积层的Relu函数:R=max(0,y)之前加入所述BN算法对输入的数据进行标准化处理;
[0034]其中,y为卷积处理后的输出值;假设x
i
表示所述VGG模型的第1层的输入的第i个数据,x
~i
表示标准化处理后的数据,m为单个训练样本包含的输入数据个数,ε取值10
‑8,参数Y和β是通过梯度下降法求得的常数,μ表示输入数据的均值,σ表示方差取值为1,表示数据的中间值,所述BN算法包括:
[0035][0036][0037][0038][0039]在一种具体实现方式中,所述基于所述训练集和所述验证集对所述新的VGG模型进行训练和验证,得到第二分类模型,包括:
[0040]根据所述训练集中标定的多个病理图像,利用CAN的对抗训练方式对所述新的VGG模型进行训练,并根据所述验证集中的病理图像对训练后得到的模型进行验证,得到所述第二分类模型。
[0041]本专利技术实施例的第二方面一种基于机器学习的肝癌分类处理装置,包括:
[0042]图像获取模块,用于获取待进行肝癌分类检测的医学影像和病理图像,所述医学影像为针对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的肝癌分类处理方法,其特征在于,包括:获取待进行肝癌分类检测的医学影像和病理图像,所述医学影像为针对肝脏部分扫描得到的增强电子计算机断层扫描CT图像或者核磁共振图像;将所述医学影像输入第一分类模型得到第一分类结果,并将所述病理图像输入第二分类模型得到第二分类结果;其中,所述第一分类模型是基于加权Fisher构造的神经网络模型训练得到的对肝癌进行识别分类的模型,所述第二分类模型是基于在VGG模型中增加BN算法之后进行训练得到的对肝癌病理图像进行分类的模型;根据所述第一分类结果和所述第二分结果确定最终的肝癌分类结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一分类结果和所述第二分结果确定最终的肝癌分类结果,包括;若所述第一分类结果和所述第二分类结果相同,则将其中任一结果确定为最终的肝癌分类结果;若所述第一分类结果和所述第二分类结果不同,则将所述病理图像通过随机裁剪和随机颜色失真的数据方法进行扩充,得到增强处理后的病理图像;将所述增强处理后的病理图像输入所述第二分类模型中进行处理,得到最终的肝癌分类结果。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:将获取到的医学影像集合中的影像分为训练集和验证集,所述医学影像集合中包括多个已经标定的正常肝脏的医学影像以及每个分类的肝癌对应的多个医学影像;针对所述训练集中的医学影像,将医学影像输入预先构造的神经网络模型的卷积层中进行卷积处理,得到第一卷积特征集合;将所述第一卷积特征集合进行均值采样的方法进行处理,得到第二卷积特征集合;将所述第二卷积特征集合输入所述神经网络模型的全连接层进行处理,最终输出所述神经网络模型的预测结果;运用加权Fisher准则对应的函数作为损失函数,计算医学影像的标定结果和所述预测结果之间的损失值,并基于所述损失值经过反向传播传递残差修正模型参数,重复前述步骤直至所述损失值收敛,采用所述验证集对训练的模型进行验证,得到所述第一分类模型。4.根据权利要求3所述的方法,其特征在于,初始构造的神经网络模型的卷积层的公式为:其中,M
e
表示输入的图像集合,表示神经网络模型卷积中的第l层中的第e个特征图像,K
l
表示第l层的卷积核,*表示卷积运算,表示与第l

1层第f个特征图像进行相连的滤波器,表示偏置,f(
·
)表示神经元非线性激活函数。5.根据权利要求3所述的方法,其特征在于,所述加权Fisher准则对应的损失函数为:Y=Y(W,b)

αY
B
+βY
w
;其中,α和β为常数系数,取值范围在0

1之间,Y
B
表示类间距离的度量函数,Y
w
表示类内距离度量的函数;
Δ
ij
表示第i类样本和第j类...

【专利技术属性】
技术研发人员:刘龑昊韩小岛王凤娟杜雯
申请(专利权)人:青岛市中心医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1