【技术实现步骤摘要】
一种模型训练方法及装置
[0001]本专利技术涉及智能检测的
,具体涉及一种模型训练方法及装置。
技术介绍
[0002]目前,基于深度学习的目标对象检测方法,大多局限于通过前期预处理将完整的图像切块直接作为检测模型的输入,检测精度低,而且,由于限定了检测区域,还导致单次检测的时间较长,即检测效率低。
技术实现思路
[0003]因此,本专利技术要解决现有技术中针对使用已有的检测模型进行目标对象的检测,其检测精度低且检测效率低的技术问题,从而提供一种模型训练方法及装置。
[0004]根据第一方面,本专利技术实施例提供了一种模型训练方法,包括如下步骤:
[0005]获取多张第一图像;
[0006]针对每一所述第一图像,提取所述第一图像中的第一对象;并获取从所述第一图像中标注的第二对象实例,作为第二对象实例标签;
[0007]获取所述第一对象的轮廓;
[0008]根据所述第一对象的轮廓和所述第二对象实例,获取所述第二对象的轮廓,作为第二对象轮廓标签;
[0009]将所述第一对象输入至待训练模型,获取所述待训练模型的输出;所述待训练模型包括轮廓检测分支和实例检测分支,所述输出包括第二对象轮廓输出和第二对象实例输出;所述实例检测分支基于所述第一对象和所述轮廓检测分支提取得到的轮廓特征检测第二对象轮廓;
[0010]分别基于所述第二对象实例标签和所述第二对象实例输出计算第一损失函数值,基于所述第二对象轮廓标签和所述第二对象轮廓输出计算第二损失函数值;r/>[0011]根据所述第一损失函数值和所述第二损失函数值计算第三损失函数值;
[0012]基于所述第三损失函数值,调整所述待训练模型的参数。
[0013]可选地,所述将所述第一对象输入至待训练模型包括:
[0014]根据从所述第一对象标注得到的第二对象,在所述第一对象中的位置对所述第二对象进行划分;
[0015]统计各位置的所述第二对象的数量;
[0016]基于所述数量,使用沿横断面翻转、添加离散高斯噪声和进行直方图均衡化中的至少之一方式,对所述第一对象进行位置均衡扩增;
[0017]将所述第一对象和扩增得到的所述第一对象输入至所述待训练模型。
[0018]可选地,所述待训练模型包括编码块、特征提取块和解码块,所述轮廓检测分支和所述实例检测分支均包括所述特征提取块和所述解码块;
[0019]所述编码块包括依次连接的M组下采样结构,M组所述下采样结构用于分别得到不
同尺度的下采样结果,所述解码块包括M组与所述下采样结构一一对应的上采样结构,每一组所述下采样结构的采样结果与对应的所述上采样结构的前一级结构输出的特征拼接后作为所述上采样结构的输入特征;
[0020]所述轮廓检测分支中的所述特征提取块用于基于所述编码块的输出提取深层特征,所述实例检测分支中的所述特征提取块用于基于编码块的输出和所述轮廓检测分支中的所述解码块的中间层上采样结构的上采样结果提取深层特征,所述解码块还包括分类层,所述分类层用于基于M组所述上采样结构的输出进行分类检测。
[0021]可选地,所述编码块中的每一组所述下采样结构包括依次连接的卷积块和BiA模块,所述卷积块用于下采样,所述BiA模块包括并联的两条残差分支,所述两条残差分支用于解耦所述卷积块输出的特征,得到两个特征图,所述两个特征图分别输入所述轮廓检测分支中的所述解码块、所述实例检测分支中的所述解码块。
[0022]可选地,所述BiA模块的每一条残差分支包括依次连接的两个残差子模块;所述BiA模块还包括空间注意力机制块,所述空间注意力机制块包括依次连接的最大池化层和平均池化层,所述空间注意力机制块的输入为同一组所述下采样结构的所述卷积块的输出,所述空间注意力机制块的输出通过Sigmoid函数得到权重图,并分别与两条所述残差分支的后一个所述残差子模块的输出。
[0023]可选地,所述特征提取块包括依次连接的多个下采样层与多个上采样层;每一所述下采样层与所述上采样层之前还包括Swin
‑
Transformer层,最后一个所述下采样层与第一个所述上采样层采用一个卷积层进行拼接;最后一个所述下采样层的输出与前一个下采样层的输出通过短接实现拼接。
[0024]可选地,所述轮廓检测分支中的所述解码块的中间层上采样结构的上采样结果通过下采样至所述编码块的输出尺度后,通过Sigmoid函数得到权重图,与所述编码块的输出相加后相乘作为实例检测分支的特征提取块的输入。
[0025]可选地,所述解码块在不同尺度下进行的第一次上采样结果通过卷积调整通道数,之后与更大尺度的上采样结果元素相加,作为所述待训练模型的深监督。
[0026]可选地,利用以下公式计算所述第一损失函数值:
[0027][0028]其中,a为第a个连通域,K为所述连通域的个数,p(x
b
)为输入所述轮廓检测分支的真实值,b为所述真实值的前景1与背景0的类别,q(x
ab
)为所述轮廓检测分支的预测值,L
CE
为交叉熵损失函数,L
CDE
为所述轮廓检测分支的损失值。
[0029]可选地,利用以下公式计算所述第二损失函数值:
[0030][0031]其中,X为所述实例检测分支中预测结果的矩阵,Y为输入所述实例检测分支中的真实值,L
Dice
为所述实例检测分支的损失值。
[0032]根据第二方面,本专利技术实施例提供了一种模型训练装置,包括:第一获取模块,用
于获取多张第一图像;
[0033]处理模块,用于针对每一所述第一图像,提取所述第一图像中的第一对象;并获取从所述第一图像中标注的第二对象实例,作为第二对象实例标签;
[0034]第二获取模块,用于获取所述第一对象的轮廓;
[0035]标签模块,用于根据所述第一对象的轮廓和所述第二对象实例,获取所述第二对象的轮廓,作为第二对象轮廓标签;
[0036]检测模块,用于将所述第一对象输入至待训练模型,获取所述待训练模型的输出;所述待训练模型包括轮廓检测分支和实例检测分支,所述输出包括第二对象轮廓输出和第二对象实例输出;所述实例检测分支基于所述第一对象和所述轮廓检测分支提取得到的轮廓特征检测第二对象轮廓;
[0037]第一计算模块,用于分别基于所述第二对象实例标签和所述第二对象实例输出计算第一损失函数值,基于所述第二对象轮廓标签和所述第二对象轮廓输出计算第二损失函数值;
[0038]第二计算模块,用于根据所述第一损失函数值和所述第二损失函数值计算第三损失函数值;
[0039]调整模块,用于基于所述第三损失函数值,调整所述待训练模型的参数。
[0040]根据第三方面,本专利技术实施例提供了一种计算机设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取多张第一图像;针对每一所述第一图像,提取所述第一图像中的第一对象;并获取从所述第一图像中标注的第二对象实例,作为第二对象实例标签;获取所述第一对象的轮廓;根据所述第一对象的轮廓和所述第二对象实例,获取所述第二对象的轮廓,作为第二对象轮廓标签;将所述第一对象输入至待训练模型,获取所述待训练模型的输出;所述待训练模型包括轮廓检测分支和实例检测分支,所述输出包括第二对象轮廓输出和第二对象实例输出;所述实例检测分支基于所述第一对象和所述轮廓检测分支提取得到的轮廓特征检测第二对象轮廓;分别基于所述第二对象实例标签和所述第二对象实例输出计算第一损失函数值,基于所述第二对象轮廓标签和所述第二对象轮廓输出计算第二损失函数值;根据所述第一损失函数值和所述第二损失函数值计算第三损失函数值;基于所述第三损失函数值,调整所述待训练模型的参数。2.根据权利要求1所述的模型训练方法,其特征在于,所述将所述第一对象输入至待训练模型包括:根据从所述第一对象标注得到的第二对象,在所述第一对象中的位置对所述第二对象进行划分;统计各位置的所述第二对象的数量;基于所述数量,使用沿横断面翻转、添加离散高斯噪声和进行直方图均衡化中的至少之一方式,对所述第一对象进行位置均衡扩增;将所述第一对象和扩增得到的所述第一对象输入至所述待训练模型。3.根据权利要求1所述的模型训练方法,其特征在于,所述待训练模型包括编码块、特征提取块和解码块,所述轮廓检测分支和所述实例检测分支均包括所述特征提取块和所述解码块;所述编码块包括依次连接的M组下采样结构,M组所述下采样结构用于分别得到不同尺度的下采样结果,所述解码块包括M组与所述下采样结构一一对应的上采样结构,每一组所述下采样结构的采样结果与对应的所述上采样结构的前一级结构输出的特征拼接后作为所述上采样结构的输入特征;所述轮廓检测分支中的所述特征提取块用于基于所述编码块的输出提取深层特征,所述实例检测分支中的所述特征提取块用于基于编码块的输出和所述轮廓检测分支中的所述解码块的中间层上采样结构的上采样结果提取深层特征,所述解码块还包括分类层,所述分类层用于基于M组所述上采样结构的输出进行分类检测。4.根据权利要求3所述的方法,其特征在于,所述编码块中的每一组所述下采样结构包括依次连接的卷积块和BiA模块,所述卷积块用于下采样,所述BiA模块包括并联的两条残差分支,所述两条残差分支用于解耦所述卷积块输出的特征,得到两个特征图,所述两个特征图分别输入所述轮廓检测分支中的所述解码块、所述实例检测分支中的所述解码块。5.根据权利要求4所述的方法,其特征在于,所述BiA模块的每一条残差分支包括依次
连接的两个残差子模块;所述BiA模块还包括空间注意力机制块,所述空间注意力机制块包括依次连接的最大池化层和平均池化层,所述空间注意力机制块的输入为同一组所述下采样结构的所述卷积块的输出,所述空间注意力机制块的输出通过Sigmoid函数得到权重图,并分别与两条所述残差分支的后一个所述残差子模块的输出。6.根据权利要求3所述的方法,其特征在于,所述特征提取块包括依次连接的多个下采样层与多个上...
【专利技术属性】
技术研发人员:戴亚康,耿辰,戴斌,周志勇,李凤美,
申请(专利权)人:济南国科医工科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。