一种医学影像识别训练方法技术

技术编号:24997516 阅读:59 留言:0更新日期:2020-07-24 17:59
本发明专利技术的一种医学影像识别训练方法,在医学图像处理领域基于强化学习理念设计多种训练策略,建立医学图像自动化识别机制。本发明专利技术提出的优化框架打破了以往深度学习方法的单一化,能从结构和参数两个方面联合优化共同提高模型性能。可用于少样本识别任务的子网络由控制器动态生成,可节省人为设计花费的时间和精力。网络架构的生成策略直接由数据集中的任务分布决定,使子网络熟悉复杂而多变的任务环境,更加适合运用在少量标注数据的分类场景。

【技术实现步骤摘要】
一种医学影像识别训练方法
本专利技术属于医学图像识别
,具体来说是一种医学影像识别训练方法。
技术介绍
在医疗影像方面,人工智能已经证明了它有能力通过快速准确地标记特定异常结构来提高图像分析的效率,以供放射科医师参考。2011年,纽约大学LangoneHealth的研究人员发现,这种类型的自动分析在找到并匹配特定的肺结节(胸部CT图像)方面,可以比放射学家们快62%到97%。研究结果表明,这种人工智能带来的图像分析效率,可以让放射学家腾出更多的时间聚焦在需要更多解读或判断的内容审阅上,从而每年节省30亿美元。近来最新的研究还探索了人工智能在制药、分子结构和生物蛋白质方面的探索,这些令人激动的研究都在证明着AI的能力,拓展着AI的疆界。近年来,人工智能技术取得了飞跃般的进步,如AlphaGO在象棋游戏中击败了人类冠军,ResNet在图像分类方面超越了人类表现,微软的语音系统在语音翻译种接近人类水平。然而这些人工智能技术的成功应用还未实现全自动化,即无法通过经验自动改进。在人工智能技术和医学应用全面结合的时候,当算法没有在实际问题上取得良好的性能时候,需要医学专家和人工智能专家共同解决这一问题,需要丰富的专家知识并消耗大量时间,专家知识是稀缺资源,人工智能在医学领域应用需要付出昂贵的代价。
技术实现思路
1.专利技术要解决的技术问题本专利技术的目的在于解决现有的医学影像识别难以自动化且识别效果差的问题。2.技术方案为达到上述目的,本专利技术提供的技术方案为:>本专利技术的一种医学影像识别训练方法,包括如下步骤:S100、数据收集,从特征样本库准备训练数据集,将其分为训练集、验证集和测试集;S200、数据筛选,对收集的数据范围进行规定,去除无关的数据,再对候选样本进行审核;S300、数据处理,对筛选后的数据进行归一化、旋转、扩增等预处理;S400、搭建算法框架,通过循环网络RNN构成的控制器来搭建算法框架;S500、建立优化搜索目标,设计损失函数,损失函数为minθ,A∑τL(D′τ,θ′τ)=∑τL(D′τ,T(Dτ,θ)),其中Dτ和D′τ分别代表任务分别代表任务τ上的训练集和测试集,Lτ为loss,(T(Dτ,θ)是在Dτ,上的训练过程,L(D′τ,T(Dτ,θ))是测试样本D′τ在更新后的参数θ’上计算而得的损失值;S600、建立可迁移框架,运用LSTM网络作为控制器来搭建可迁移的框架;S700、网络训练,在控制器网络输入训练集进行控制网络训练,提高高精度模型的生成概率,同时减少低精度模型的生成概率;S800、训练子模型,输入训练集进行子网络模型训练,将每种任务都视为一个独立的学习问题,不断地对任务进行采样,并对其进行训练,然后将初始化移向该任务的更新后权重,完成了子模型的训练过程;S900、检测模型收敛,当完成收敛后,选取在元数据集中表现最好的架构准确率重新训练,获得最终准确率,保存网络模型。优选的,所述步骤S100中的特征样本库为包含有大量正常人医学影像以及患者的医学影像数据的数据库。优选的,所述步骤S300中的扩增处理的方式包括对图像进行旋转、剪裁、饱和度调节、色调调节和曝光时间调节,对扩增处理后的背景图像进行图像类别标注,并对标注后的背景图像进行归一化处理。优选的,所述步骤S400中算法框架还包括循环网络RNN构成的控制器从搜索域中选择不同大小的卷积核以及池化层来定义子网络,由控制器生成的子模型架构通过Reptile算法在元数据集上进行训练,并返回准确性作为奖励来评估控制器的体系结构选择策略,奖励函数的评估在验证集上进行。优选的,所述步骤S600中控制器旨在生成四层子模型体系结构,分别为K1、K2、K3和K4层,创建每一层时需要做出两步决策:(1)控制器从搜索域中选择出当前层所需的操作符,如卷积、池化;(2)要选择哪层进行跳跃连接,搜索域包括:内核大小为3x3、5x5和7x7的卷积,内核大小为3x3、5x5和7x7的深度可分卷积,以及内核大小为3x3的平均池化和最大池化。优选的,所述步骤S700中将当前生成模型与历史模型的平均水平相比较,Aj=Rj-blj,bl为生成架构精度的指数移动平均值,其中Aj代表由控制器选择的第j个架构字符串,Rj代表第j个架构在验证集上计算的准确度。优选的,所述步骤S400中,控制器在搜索域中进行搜索时,通过经验回放机制来减少控制器与环境的交互次数,并鼓励控制器利用其在不断变化的环境中积累的经验,所述S700中,将系列(Sj,Aj,Rj)存储在经验池中,其中Aj代表由控制器选择的第j个架构字符串,Sj表示控制器的输入状态,Rj代表第j个架构在验证集上计算的准确度,经验将会根据Rj的优劣,判断是否将其存放进经验池内。3.有益效果采用本专利技术提供的技术方案,与现有技术相比,具有如下有益效果:本专利技术的一种医学影像识别训练方法,在医学图像处理领域基于强化学习理念设计多种训练策略,建立医学图像自动化识别机制。本专利技术提出的优化框架打破了以往深度学习方法的单一化,能从结构和参数两个方面联合优化共同提高模型性能。可用于少样本识别任务的子网络由控制器动态生成,可节省人为设计花费的时间和精力。网络架构的生成策略直接由数据集中的任务分布决定,使子网络熟悉复杂而多变的任务环境,更加适合运用在少量标注数据的分类场景。附图说明图1为本专利技术采用的网络拓扑结构图;图2为本专利技术采用的整体算法功能展示框架图;图3为本专利技术采用基于LSTM网络的控制器神经网络图;图4为本专利技术采用的控制器输出预测流程示意图;图5为本专利技术采用的控制器经验流程回放示意图;图6为本专利技术采用的子模型训练过程参数更新示意图;图7为本专利技术的方法流程图。具体实施方式为了便于理解本专利技术,下面将参照相关附图对本专利技术进行更全面的描述,附图中给出了本专利技术的若干实施例,但是,本专利技术可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本专利技术的公开内容更加透彻全面。需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件;当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件;本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同;本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术;本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。实施例1参照附图1-附图7,本实施例的一种医学影像识别训练方法,包括如下步骤:S100、数据收集,从特征样本库准备训练数据集,将其分为训练集本文档来自技高网...

【技术保护点】
1.一种医学影像识别训练方法,其特征在于,包括如下步骤:/nS100、数据收集,从特征样本库准备训练数据集,将其分为训练集、验证集和测试集;/nS200、数据筛选,对收集的数据范围进行规定,去除无关的数据,再对候选样本进行审核;/nS300、数据处理,对筛选后的数据进行归一化、旋转、扩增等预处理;/nS400、搭建算法框架,通过循环网络RNN构成的控制器来搭建算法框架;/nS500、建立优化搜索目标,设计损失函数,损失函数为min

【技术特征摘要】
1.一种医学影像识别训练方法,其特征在于,包括如下步骤:
S100、数据收集,从特征样本库准备训练数据集,将其分为训练集、验证集和测试集;
S200、数据筛选,对收集的数据范围进行规定,去除无关的数据,再对候选样本进行审核;
S300、数据处理,对筛选后的数据进行归一化、旋转、扩增等预处理;
S400、搭建算法框架,通过循环网络RNN构成的控制器来搭建算法框架;
S500、建立优化搜索目标,设计损失函数,损失函数为minθ,A∑τL(D′τ,θ′τ)=∑τL(D′τ,T(Dτ,θ)),其中Dτ和D′τ分别代表任务分别代表任务τ上的训练集和测试集,Lτ为loss,(T(Dτ,θ)是在Dτ,上的训练过程,L(D′τ,T(Dτ,θ))是测试样本D′τ在更新后的参数θ’上计算而得的损失值;
S600、建立可迁移框架,运用LSTM网络作为控制器来搭建可迁移的框架;
S700、网络训练,在控制器网络输入训练集进行控制网络训练,提高高精度模型的生成概率,同时减少低精度模型的生成概率;
S800、训练子模型,输入训练集进行子网络模型训练,将每种任务都视为一个独立的学习问题,不断地对任务进行采样,并对其进行训练,然后将初始化移向该任务的更新后权重,完成了子模型的训练过程;
S900、检测模型收敛,当完成收敛后,选取在元数据集中表现最好的架构准确率重新训练,获得最终准确率,保存网络模型。


2.根据权利要求1所述的一种医学影像识别训练方法,其特征在于:所述步骤S100中的特征样本库为包含有大量正常人医学影像以及患者的医学影像数据的数据库。


3.根据权利要求1所述的一种医学影像识别训练方法,其特征在于:所述步骤S300中的扩增处理的方式包括对图像进行旋转、剪裁、饱和度调节、色调调节和曝光时间调节,...

【专利技术属性】
技术研发人员:高欣石华铮冯刚杨春山孙明祥
申请(专利权)人:上海全景医学影像诊断中心有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1