图像识别模型的训练方法、识别方法、装置、介质和设备制造方法及图纸

技术编号：33274923 阅读：17 留言：0更新日期：2022-04-30 23:33

本公开涉及一种图像识别模型的训练方法、识别方法、装置、介质和设备，该方法包括：获取多个训练样本集，每个训练样本集的数据分布不完全一致，针对每个训练图像，根据该训练图像和该训练图像对应的训练识别结果，确定该训练图像的梯度，根据每个训练图像的梯度，确定每个训练样本集的第一统计量和第二统计量，根据第一统计量和第二统计量，确定统计量损失函数，根据统计量损失函数对预设模型进行更新，得到图像识别模型。本公开可以根据由第一统计量和第二统计量确定的统计量损失函数，更新预设模型，得到泛化性能高的图像识别模型，并且无需对图像识别模型进行额外的微调，能够避免造成过拟合问题，提高了图像识别模型的识别准确度。确度。确度。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别模型的训练方法、识别方法、装置、介质和设备

[0001]本公开涉及图像处理
，具体地，涉及一种图像识别模型的训练方法、识别方法、装置、介质和设备。

技术介绍

[0002]结直肠癌是我国发病率最高的恶性肿瘤之一，但癌症的早期诊断和适当治疗可以带来约90%的治愈率。定期肠镜筛查可以识别腺瘤性息肉，并预防癌症。在内镜检查过程中，识别内镜图像中的回盲部至关重要。
[0003]当前，对内镜图像识别主要是基于深度神经网络（例如，卷积神经网络），为了取得良好的泛化性能，需要搜集大量的训练数据进行训练。而训练数据可能来自同一个医疗中心，也可能来自不同的医疗中心。然而，相关技术中的方法忽略了模型在新中心上的泛化问题，也没有重视多中心的训练数据中的额外知识。这会导致在每次部署模型到新的中心时，都需要收集新中心的数据来微调训练好的模型，以确保模型的泛化性能，否则会影响模型对内镜图像识别的准确度。并且，每次部署模型时微调训练好的模型过程复杂，同时可能会造成过拟合等问题，影响模型的识别准确度。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面，本公开提供一种图像识别模型的训练方法，所述方法包括：获取多个训练样本集；所述训练样本集包括训练图像以及所述训练图像对应的训练识别结果，每个所述训练样本...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法，其特征在于，所述方法包括：获取多个训练样本集；所述训练样本集包括训练图像以及所述训练图像对应的训练识别结果，每个所述训练样本集的数据分布不完全一致；针对每个所述训练图像，根据该训练图像和该训练图像对应的训练识别结果，确定该训练图像的梯度；根据每个所述训练图像的梯度，确定每个所述训练样本集的第一统计量和每个所述训练样本集的第二统计量；所述第一统计量用于表征所述训练样本集对应的均值向量，所述第二统计量用于表征所述训练样本集对应的协方差矩阵；根据所述第一统计量和所述第二统计量，确定统计量损失函数；根据所述统计量损失函数，对预设模型进行更新，得到图像识别模型。2.根据权利要求1所述的方法，其特征在于，所述预设模型包括特征提取网络和分类器；所述根据该训练图像和该训练图像对应的训练识别结果，确定该训练图像的梯度，包括：对该训练图像进行预处理，得到预处理后的训练图像；将所述预处理后的训练图像输入到所述特征提取网络中，得到该训练图像的图像特征；将该训练图像的图像特征输入到所述分类器，得到该训练图像的预测识别结果；根据该训练图像的预测识别结果、训练识别结果和图像特征，确定该训练图像的梯度。3.根据权利要求2所述的方法，其特征在于，所述对该训练图像进行预处理，得到预处理后的训练图像，包括：对该训练图像进行随机数据增强，得到所述预处理后的训练图像；所述随机数据增强包括随机缩放、随机裁剪、随机翻转、随机颜色抖动中的至少一种。4.根据权利要求1所述的方法，其特征在于，所述根据每个所述训练图像的梯度，确定每个所述训练样本集的第一统计量和每个所述训练样本集的第二统计量，包括：根据每个所述训练样本集包括的全部训练图像的梯度，确定该训练样本集的第一统计量；根据每个所述训练样本集包括的全部训练图像的梯度以及该训练样本集的第一统计量，确定该训练样本集的第二统计量。5.根据权利要求1所述的方法，其特征在于，所述统计量损失函数包括第一统计量损失函数和第二统计量损失函数；所述根据所述第一统计量和所述第二统计量，确定统计量损失函数，包括：根据每两个所述训练样本集的第一统计量，确定该两个所述训练样本集对应的所述第一统计量损失函数；根据每两个所述训练样本集的第二统计量，确定该两个所述训练样本集对应的所述第二统计量损失函数。6.根据权利要求5所述的方法，其特征在于，所述根据所述统计量损失函数，对预设模型进行更新，得到图像识别模型，包括：对...

【专利技术属性】
技术研发人员：边成，李永会，杨延展，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人