图像识别模型的训练方法、识别方法、装置、介质和设备制造方法及图纸

技术编号:33274923 阅读:17 留言:0更新日期:2022-04-30 23:33
本公开涉及一种图像识别模型的训练方法、识别方法、装置、介质和设备,该方法包括:获取多个训练样本集,每个训练样本集的数据分布不完全一致,针对每个训练图像,根据该训练图像和该训练图像对应的训练识别结果,确定该训练图像的梯度,根据每个训练图像的梯度,确定每个训练样本集的第一统计量和第二统计量,根据第一统计量和第二统计量,确定统计量损失函数,根据统计量损失函数对预设模型进行更新,得到图像识别模型。本公开可以根据由第一统计量和第二统计量确定的统计量损失函数,更新预设模型,得到泛化性能高的图像识别模型,并且无需对图像识别模型进行额外的微调,能够避免造成过拟合问题,提高了图像识别模型的识别准确度。确度。确度。

【技术实现步骤摘要】
图像识别模型的训练方法、识别方法、装置、介质和设备


[0001]本公开涉及图像处理
,具体地,涉及一种图像识别模型的训练方法、识别方法、装置、介质和设备。

技术介绍

[0002]结直肠癌是我国发病率最高的恶性肿瘤之一,但癌症的早期诊断和适当治疗可以带来约90%的治愈率。定期肠镜筛查可以识别腺瘤性息肉,并预防癌症。在内镜检查过程中,识别内镜图像中的回盲部至关重要。
[0003]当前,对内镜图像识别主要是基于深度神经网络(例如,卷积神经网络),为了取得良好的泛化性能,需要搜集大量的训练数据进行训练。而训练数据可能来自同一个医疗中心,也可能来自不同的医疗中心。然而,相关技术中的方法忽略了模型在新中心上的泛化问题,也没有重视多中心的训练数据中的额外知识。这会导致在每次部署模型到新的中心时,都需要收集新中心的数据来微调训练好的模型,以确保模型的泛化性能,否则会影响模型对内镜图像识别的准确度。并且,每次部署模型时微调训练好的模型过程复杂,同时可能会造成过拟合等问题,影响模型的识别准确度。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面,本公开提供一种图像识别模型的训练方法,所述方法包括:获取多个训练样本集;所述训练样本集包括训练图像以及所述训练图像对应的训练识别结果,每个所述训练样本集的数据分布不完全一致;针对每个所述训练图像,根据该训练图像和该训练图像对应的训练识别结果,确定该训练图像的梯度;根据每个所述训练图像的梯度,确定每个所述训练样本集的第一统计量和每个所述训练样本集的第二统计量;所述第一统计量用于表征所述训练样本集对应的均值向量,所述第二统计量用于表征所述训练样本集对应的协方差矩阵;根据所述第一统计量和所述第二统计量,确定统计量损失函数;根据所述统计量损失函数,对预设模型进行更新,得到图像识别模型。
[0006]第二方面,本公开提供一种图像识别方法,所述方法包括:获取待识别图像;将所述待识别图像输入预先训练好的图像识别模型,得到所述待识别图像的识别结果;其中,所述图像识别模型是通过第一方面所述的图像识别模型的训练方法训练得到的。
[0007]第三方面,本公开提供一种图像识别模型的训练装置,所述图像识别模型的训练
装置包括:第一获取模块,用于获取多个训练样本集;所述训练样本集包括训练图像以及所述训练图像对应的训练识别结果,每个所述训练样本集的数据分布不完全一致;确定模块,用于针对每个所述训练图像,根据该训练图像和该训练图像对应的训练识别结果,确定该训练图像的梯度;所述确定模块,还用于根据每个所述训练图像的梯度,确定每个所述训练样本集的第一统计量和每个所述训练样本集的第二统计量;所述第一统计量用于表征所述训练样本集对应的均值向量,所述第二统计量用于表征所述训练样本集对应的协方差矩阵;所述确定模块,还用于根据所述第一统计量和所述第二统计量,确定统计量损失函数;更新模块,用于根据所述统计量损失函数,对预设模型进行更新,得到图像识别模型。
[0008]第四方面,本公开提供一种图像识别装置,所述图像识别装置包括:第二获取模块,用于获取待识别图像;处理模块,用于将所述待识别图像输入预先训练好的图像识别模型,得到所述待识别图像的识别结果;其中,所述图像识别模型是通过第三方面所述的图像识别模型的训练装置训练得到的。
[0009]第五方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面或第二方面所述方法的步骤。
[0010]第六方面,本公开提供一种电子设备,包括:存储装置,其上存储有计算机程序;处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面或第二方面所述方法的步骤。
[0011]通过上述技术方案,本公开首先获取多个包括训练图像和训练识别结果的训练样本集,再针对每个训练图像,根据该训练图像和该训练图像对应的训练识别结果,确定该训练图像的梯度,并根据每个训练图像的梯度,确定每个训练样本集的第一统计量和每个训练样本集的第二统计量,最后根据第一统计量和第二统计量,确定统计量损失函数,并根据统计量损失函数,对预设模型进行更新,得到图像识别模型。本公开可以根据第一统计量和第二统计量,确定统计量损失函数,并利用统计量损失函数更新预设模型,使预设模型能够使用多个训练样本集的训练图像学习具有中心不变性的图像特征,并捕捉与图像识别相关的具有判别性的信息,忽略特定训练样本集的噪声,从而得到泛化性能高的图像识别模型,能够确保对待识别图像进行识别的准确度,并且无需对图像识别模型进行额外的微调,能够避免造成过拟合问题,提高了图像识别模型的识别准确度。
[0012]本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0013]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
图1是根据一示例性实施例示出的一种图像识别模型的训练方法的流程图;图2是根据图1所示实施例示出的一种步骤102的流程图;图3是根据图1所示实施例示出的一种步骤103的流程图;图4是根据图1所示实施例示出的一种步骤104的流程图;图5是根据一示例性实施例示出的一种图像识别方法的流程图;图6是根据一示例性实施例示出的一种图像识别模型的训练装置的框图;图7是根据图6所示实施例示出的一种确定模块的框图;图8是根据一示例性实施例示出的一种图像识别装置的框图;图9是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
[0014]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0015]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0016]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
[0017]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法,其特征在于,所述方法包括:获取多个训练样本集;所述训练样本集包括训练图像以及所述训练图像对应的训练识别结果,每个所述训练样本集的数据分布不完全一致;针对每个所述训练图像,根据该训练图像和该训练图像对应的训练识别结果,确定该训练图像的梯度;根据每个所述训练图像的梯度,确定每个所述训练样本集的第一统计量和每个所述训练样本集的第二统计量;所述第一统计量用于表征所述训练样本集对应的均值向量,所述第二统计量用于表征所述训练样本集对应的协方差矩阵;根据所述第一统计量和所述第二统计量,确定统计量损失函数;根据所述统计量损失函数,对预设模型进行更新,得到图像识别模型。2.根据权利要求1所述的方法,其特征在于,所述预设模型包括特征提取网络和分类器;所述根据该训练图像和该训练图像对应的训练识别结果,确定该训练图像的梯度,包括:对该训练图像进行预处理,得到预处理后的训练图像;将所述预处理后的训练图像输入到所述特征提取网络中,得到该训练图像的图像特征;将该训练图像的图像特征输入到所述分类器,得到该训练图像的预测识别结果;根据该训练图像的预测识别结果、训练识别结果和图像特征,确定该训练图像的梯度。3.根据权利要求2所述的方法,其特征在于,所述对该训练图像进行预处理,得到预处理后的训练图像,包括:对该训练图像进行随机数据增强,得到所述预处理后的训练图像;所述随机数据增强包括随机缩放、随机裁剪、随机翻转、随机颜色抖动中的至少一种。4.根据权利要求1所述的方法,其特征在于,所述根据每个所述训练图像的梯度,确定每个所述训练样本集的第一统计量和每个所述训练样本集的第二统计量,包括:根据每个所述训练样本集包括的全部训练图像的梯度,确定该训练样本集的第一统计量;根据每个所述训练样本集包括的全部训练图像的梯度以及该训练样本集的第一统计量,确定该训练样本集的第二统计量。5.根据权利要求1所述的方法,其特征在于,所述统计量损失函数包括第一统计量损失函数和第二统计量损失函数;所述根据所述第一统计量和所述第二统计量,确定统计量损失函数,包括:根据每两个所述训练样本集的第一统计量,确定该两个所述训练样本集对应的所述第一统计量损失函数;根据每两个所述训练样本集的第二统计量,确定该两个所述训练样本集对应的所述第二统计量损失函数。6.根据权利要求5所述的方法,其特征在于,所述根据所述统计量损失函数,对预设模型进行更新,得到图像识别模型,包括:对...

【专利技术属性】
技术研发人员:边成李永会杨延展
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1