一种用于CT图像识别的神经网络架构方法技术

技术编号:27658436 阅读:13 留言:0更新日期:2021-03-12 14:23
本发明专利技术公开了一种用于CT图像识别的神经网络架构方法,包括:获取待训练的CT图像数据集,根据CT图像的类型确定候选神经网络的类型;定义神经网络的基本架构,设置该神经网络基本架构的搜索空间;搜索Cell的基本结构,采用搜索算法对神经网络架构进行搜索;采用低保真的训练集对神经网络进行训练;将CT图像数据集分为测试集和验证集,将测试集输入至神经网络,将验证集的准确率作为搜索算法的评估标准,获取最优的Cell从而得到适用于该数据集的最优架构,将最优架构作为识别算法用于CT图像伪影的识别。

【技术实现步骤摘要】
一种用于CT图像识别的神经网络架构方法
本专利技术涉及医学图像处理
,尤其涉及一种用于CT图像识别的神经网络架构方法。
技术介绍
人工智能是当下学术界和产业界的一个热点,经过近几年的高速发展,深度学习已经实现了在传统的图像、视频、语音识别等领域的落地;在众多的医疗信息中,医学影像是疾病筛查和诊断、治疗决策的最主要的信息来源。深度学习应用于医疗影像的识别也成为近年来的研究热点。大部分现有技术中直接采用现成的神经网络架构比如VGG,ResNet等来处理医学图像识别问题。因目前可用于图像处理的架构较多,采用什么样的架构需要不断地试错,而深度学习算法往往体量较大,训练时间较长,而且对参数较为敏感,因此采用现成的架构对特定的数据不一定是最合适的,另外调参需要花费大量的时间。
技术实现思路
根据现有技术存在的问题,本专利技术公开了一种用于CT图像识别的神经网络架构方法,具体包括如下步骤:获取待训练的CT图像数据集,根据CT图像的类型确定候选神经网络的类型;定义神经网络的基本架构,其中该神经网络的基本架构包括三个由N个Cell构成的基本模块、作为下采样结点的Residualblock、作为神经网络输出的全局平均池化模块,设置该神经网络基本架构的搜索空间;搜索Cell的基本结构,采用搜索算法对神经网络架构进行搜索;采用低保真的训练集对神经网络进行训练;将CT图像数据集分为测试集和验证集,将测试集输入至神经网络,将验证集的准确率作为搜索算法的评估标准,获取最优的Cell从而得到适用于该数据集的最优架构,将最优架构作为识别算法用于CT图像伪影的识别。进一步的,该神经网络的基本架构的搜索空间包括1×1conv、3×3conv、identity、3×3avg、avg几种基本组件。进一步的,所述搜索算法包括强化学习、进化计算、贝叶斯优化和梯度算法。由于采用了上述技术方案,本专利技术提供的一种用于CT图像识别的神经网络架构方法,该方法首先获取待处理的CT图像分析任务,并根据任务确定对应的候选网络模型,采用预设网络单元对神经网络架构搜索,以得到搜索网络模型。具体如下有益效果:采用神经网络架构搜索的方法替代原来的现成模型,神经网络架构搜索出的模型因由具体的任务而定,网络较为简洁,另外由于采用神经网络架构搜索方法搜索出的网络模型,在安全领域属于黑盒问题,因为搜索出的架构具有一定的随机性,搜索出的网络架构与现成模型存在差异,在信息安全领域属于较为安全的方法,不属于白盒攻击的问题,另外采用神经网络架构方法来设计深度学习模型,不需要具备深厚的专业计算机背景知识,这对于医疗从业者来说是有益的。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术方法的流程图;图2为本专利技术方法的整体框架图;图3为本专利技术中神经网络架构搜索框架示意图。具体实施方式为使本专利技术的技术方案和优点更加清楚,下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚完整的描述:如图1和图2所示的一种用于CT图像识别的神经网络架构方法,该方法具体包括如下步骤:S1:确定待处理的CT图像识别任务,根据待处理的CT图像识别任务确定候选网络模型的类型,其中,待处理的CT图像识别任务可以是伪影识别任务,也就是有伪影和无伪影图像分类任务,与该任务对应的候选网络模型的类型为卷积神经网络。待处理的CT图像任务也可以是肿瘤识别任务,肿瘤识别任务识别不同类别的肿瘤及亚型,同样对应的候选网络模型为卷积神经网络。。S2:定义候选网络模型的基本架构,,该神经网络包括卷积模块、残差模块、池化模板,另外确定神经元(Cell)的个数N的大小,其中N的大小决定了模型的大小,理论上每一次下采样,神经网络训练的通道数会增加1倍。S3:根据待处理的CT图像任务确定候选网络模型搜索空间,搜索空间为基本的用于图像处理的卷积神经网络所用的元素,另外定义Cell的基本结构。S4:如图3所示,搜索Cell的基本结构,采用搜索算法对神经网络架构进行搜索;搜索空间定义了优化问题的变量,网络结构和超参数的变量定义有所不同,不同的变量规模对于算法的难度来说也不尽相同,比如可以采用强化学习、进化计算、贝叶斯优化和梯度算法等现有的搜索方法,在本专利技术中,采用经过改进的进化计算作为搜索算法。传统的进化算法以目标的适应度值作为驱动,适应度较好的个体被保存为下一代种群的双亲个体,这种方法虽然一定程度上解决了进化计算的驱动问题,但是因为适应度值作为导向容易忽略一些较为新颖的个体,尤其是在神经网络架构搜索问题中,新颖性有时候意味着有潜力的网络。因此在传统进化算法的基础上,本专利技术采用新颖性和适应度值双驱动的进化计算算法。S5:采用低保真的训练集对神经网络进行训练,具体的训练过程是把CT图像像素降低进行训练,即原图像为256×256,而在训练的过程中采用64×64来降低训练和评估复杂度,在评价预估中还通过减少训练轮次来降低计算量。进一步的,用低保真的训练集来训练模型,低保真在实际应用可以有多种表达,比如训练更少的次数(epochs),降低原始数据的分辨率,每一层用更少的滤波器等。用这种低保真的训练集来测试优化算法会大大降低计算时间,但也存在一定的bias,不过选择最优的架构只需要有相对值就可以进行排序选优。S6:将待处理的CT图像数据集分为测试集和验证集,将测试集输入至目标网络模型,将验证集的准确率作为搜索算法的评估标准,获取最优的Cell的基本结构,从而得到适用于该数据集的最优架构,将最优架构作为识别算法用于CT图像伪影的识别。医学图像往往像素较高,在训练的时候预评估方法显得非常重要。评价预估类似于工程优化中的代理模型(Surrogatemodel),因为深度学习模型的效果非常依赖于训练数据的规模,大规模数据上的模型训练会非常耗时,对优化结果的评价将会非常耗时,所以需要一些手段去做近似的评估。以上所述,仅为本专利技术较佳的具体实施方式,但本专利技术的保护范围并不局限于此,任何熟悉本
的技术人员在本专利技术揭露的技术范围内,根据本专利技术的技术方案及其专利技术构思加以等同替换或改变,都应涵盖在本专利技术的保护范围之内。本文档来自技高网
...

【技术保护点】
1.一种用于CT图像识别的神经网络架构方法,其特征在于包括:/n获取待训练的CT图像数据集,根据CT图像的类型确定候选神经网络的类型;/n定义神经网络的基本架构,其中该神经网络的基本架构包括三个由N个Cell构成的基本模块、作为下采样结点的Residual block、作为神经网络输出的全局平均池化模块;/n设置该神经网络基本架构的搜索空间;/n搜索Cell的基本结构,采用搜索算法对神经网络架构进行搜索;/n采用低保真的训练集对神经网络进行训练;/n将CT图像数据集分为测试集和验证集,将测试集输入至神经网络,将验证集的准确率作为搜索算法的评估标准,获取最优的Cell从而得到适用于该数据集的最优架构,将最优架构作为识别算法用于CT图像伪影的识别。/n

【技术特征摘要】
1.一种用于CT图像识别的神经网络架构方法,其特征在于包括:
获取待训练的CT图像数据集,根据CT图像的类型确定候选神经网络的类型;
定义神经网络的基本架构,其中该神经网络的基本架构包括三个由N个Cell构成的基本模块、作为下采样结点的Residualblock、作为神经网络输出的全局平均池化模块;
设置该神经网络基本架构的搜索空间;
搜索Cell的基本结构,采用搜索算法对神经网络架构进行搜索;
采用低保真的训练集对神经网络进行训练;
将CT图像数据集...

【专利技术属性】
技术研发人员:金瑾于丹李雪马壮王澈张彤
申请(专利权)人:大连东软教育科技集团有限公司
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1