内窥镜图像识别模型的训练方法、图像识别方法及装置制造方法及图纸

技术编号：37454225 阅读：17 留言：0更新日期：2023-05-06 09:26

本公开涉及一种内窥镜图像识别模型的训练方法、图像识别方法及装置，以减少数量多的样本在训练中占据主导的问题，提高内窥镜图像识别模型的泛化性能和鲁棒性。其中，该训练方法包括：获取样本内窥镜图像集；针对每一样本图像，将该样本图像输入内窥镜图像识别模型，得到对应的预测回盲结果，并根据样本图像对应的预测回盲结果和样本回盲结果，确定样本图像对内窥镜图像识别模型的样本影响值，根据样本影响值，确定样本图像的样本权重，其中样本影响值与样本权重负相关；根据每个样本图像对应的样本回盲结果、预测回盲结果和样本权重，确定目标损失函数值；根据目标损失函数值，调整内窥镜图像识别模型的参数。内窥镜图像识别模型的参数。内窥镜图像识别模型的参数。

全部详细技术资料下载

【技术实现步骤摘要】
内窥镜图像识别模型的训练方法、图像识别方法及装置

[0001]本公开涉及图像处理
，具体地，涉及内窥镜图像识别模型的训练方法、图像识别方法及装置。

技术介绍

[0002]内窥镜可以利用电子肠镜到达回盲部，从黏膜侧观察结肠病变。因此，在内窥镜检查过程中，对回盲部的识别至关重要。
[0003]随着深度学习技术的不断发展，逐渐将深度学习算法应用到内窥镜识别任务中。通常，深度学习算法假设不同类别样本数的比例是平衡的。但是，在实际应用中，样本数量不平衡才是常态。比如，在肠镜检查过程中，电子肠镜抵达回盲部后不再前进。因此，在回盲识别样本集中，肠镜视频中仅有极少部分帧中包含回盲部成像，非回盲部的成像远远多于回盲部成像。此种类别不平衡会导致算法更偏向于学习样本数量较多的类别，而对于样本数量较少的类别学习效果会较差，从而影响模型的回盲识别准确率。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面，本公开提供一种内窥镜图像识别模型的训练方法，所述内窥镜图像识别模型用于识别回盲部，所述方法包括：
[0006]获取样本内窥镜图像集，所述样本内窥镜图像集包括具有回盲部的回盲类样本图像和不具有回盲部的非回盲类样本图像，且所述样本内窥镜图像集中的每个样本图像标注有用于表征是否具有回盲部的样本回盲...

【技术保护点】

【技术特征摘要】
1.一种内窥镜图像识别模型的训练方法，其特征在于，所述内窥镜图像识别模型用于识别回盲部，所述方法包括：获取样本内窥镜图像集，所述样本内窥镜图像集包括具有回盲部的回盲类样本图像和不具有回盲部的非回盲类样本图像，且所述样本内窥镜图像集中的每个样本图像标注有用于表征是否具有回盲部的样本回盲结果；针对每一所述样本图像，将所述样本图像输入所述内窥镜图像识别模型，得到对应的预测回盲结果，并根据所述样本图像对应的所述预测回盲结果和所述样本回盲结果，确定所述样本图像对所述内窥镜图像识别模型的样本影响值，根据所述样本影响值，确定所述样本图像的样本权重，其中所述样本影响值与所述样本权重负相关；根据每个所述样本图像对应的所述样本回盲结果、所述预测回盲结果和所述样本权重，确定目标损失函数值；根据所述目标损失函数值，调整所述内窥镜图像识别模型的参数。2.根据权利要求1所述的方法，其特征在于，所述内窥镜图像识别模型用于通过分类器识别回盲部，所述根据所述样本图像对应的所述预测回盲结果和所述样本回盲结果，确定所述样本图像对所述内窥镜图像识别模型的样本影响值，包括：根据所述样本图像对应的所述预测回盲结果和所述样本回盲结果，确定损失函数值，并确定所述损失函数值对所述分类器参数的梯度张量；将所述梯度张量的范数确定为所述样本图像对所述内窥镜图像识别模型的样本影响值。3.根据权利要求1或2所述的方法，其特征在于，所述根据所述样本影响值，确定所述样本图像的样本权重，包括：确定所述样本影响值的倒数，并将所述倒数乘以第一预设超参数，得到所述样本图像的样本权重。4.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：将所述样本内窥镜图像集的图像数量除以所述样本内窥镜图像集中所述样本图像的同类别图像的数量，得到所述样本图像的样本比例，并将1减去所述预测回盲结果的差值确定为所述内窥镜图像识别模型对所述样本图像的识别难度；所述根据所述样本影响值，确定所述样本图像的样本权重，包括：将所述样本影响值的倒数乘以第二预设超参数后与所述样本比例的第一预设次方相乘，得到所述样本图像的样本权重；或者将所述样本影响值的倒数乘以所述第二预设超参数后与所述识别难度的第二预设次方相乘，得到所述样本图像的样本权重；或者将所述样本影响值的倒数乘以所述第二预设超参数后与所述样本比例的所述第一预设次方以及所述识别难度的所述第二预设次方相乘，得到所述样本图像的样本权重。5.根据权利要求1或2所述的方法，其特征在于，所述根据每个所述样本图像对应的所述样本回盲结果、所述预测回盲结果和所述样本权重，确定目标损失函数值，包括：根据每个所述样本图像对应的所述样本回盲结果和所述预测回盲结果，确定损失函数值，并将每个所述样本图像的所述损失函数值乘以对应的所述样本权重后...

【专利技术属性】
技术研发人员：潘俊文，王杰祥，赵家英，李永会，
申请(专利权)人：抖音视界有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人