图像检测模型训练方法、图像检测方法及装置制造方法及图纸

技术编号：39294830 阅读：10 留言：0更新日期：2023-11-07 11:02

本申请实施例提供一种图像检测模型训练方法、图像检测方法及装置，该方法包括：根据服务器发送的全局图像检测模型的参数更新局部图像检测模型的参数，以每一训练样本中的样本图像的图像特征为局部图像检测模型的输入，输出样本图像的预测分类标签，并得到局部图像检测模型的注意力分布，根据样本图像的分类标签、样本图像的预测分类标签、局部图像检测模型的注意力分布和全局图像检测模型的注意力分布，对局部图像检测模型的参数进行调整，得到当前迭代训练过程的模型参数并发送至服务器，服务器根据接收到的多个客户端发送的模型参数更新全局图像检测模型的参数，重复迭代训练过程，直至达到预设迭代终止条件，得到已训练的全局图像检测模型。练的全局图像检测模型。练的全局图像检测模型。

全部详细技术资料下载

【技术实现步骤摘要】
图像检测模型训练方法、图像检测方法及装置

[0001]本申请实施例涉及人工智能
，尤其涉及一种图像检测模型训练方法、图像检测方法及装置。

技术介绍

[0002]目前，在医疗健康的许多领域，人工智能(Artificial Intelligence,AI)越来越多地被应用到病理图像诊断中，它通过自动化分析病理图像提供了一种准确、低成本和可扩展的解决方案。AI模型需要大量数据训练才能有优异的表现，特别是数据集更多样化时AI模型的鲁棒性更强。
[0003]一般的常规做法是收集多个中心(比如医学中心和医院等机构)的数据，根据收集的数据训练AI模型，但是存在数据安全与隐私方面以及数据传输的问题。联邦学习可在一定程度上解决数据安全与隐私以及数据传输的问题，联邦学习可将训练数据和用于训练模型的设备解耦，原始数据保存在客户端，通过客户端与中央服务器合作训练模型。
[0004]然而，不同客户端使用的训练数据之间存在相当大的异质性，异质性包括数据分布不一致、数据类别不均衡等，因为数据异质性会训练出相对个性化的模型，导致训练出的模型的鲁棒性和泛化能力较低，进而使得模型的检测准确率较低。

技术实现思路

[0005]本申请实施例提供一种图像检测模型训练方法、图像检测方法及装置，可以增强图像检测模型的泛化能力，提高图像检测模型的鲁棒性和检测准确率。
[0006]第一方面，本申请实施例提供一种图像检测模型训练方法，包括：
[0007]在任一次迭代训练过程中，根据服务器发送的全局图像检测模型的参数...

【技术保护点】

【技术特征摘要】
1.一种图像检测模型训练方法，其特征在于，包括：在任一次迭代训练过程中，根据服务器发送的全局图像检测模型的参数更新局部图像检测模型的参数；针对训练样本集中的每一训练样本，以所述训练样本中的样本图像的图像特征为所述局部图像检测模型的输入，输出所述样本图像的预测分类标签，并得到所述局部图像检测模型的注意力分布，每一训练样本包括样本图像和所述样本图像的分类标签；根据当前迭代训练过程中的所述样本图像的分类标签、所述样本图像的预测分类标签、所述局部图像检测模型的注意力分布和所述全局图像检测模型的注意力分布，对所述局部图像检测模型的参数进行调整，得到当前迭代训练过程的模型参数，所述全局图像检测模型的注意力分布根据所述全局图像检测模型的参数和所述训练样本集中每一样本图像的图像特征确定；将所述当前迭代训练过程的模型参数发送至所述服务器，以使所述服务器根据接收到的多个客户端发送的所述模型参数更新所述全局图像检测模型的参数；重复所述迭代训练过程，直至达到迭代终止条件，得到已训练的全局图像检测模型。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述训练样本集中每一样本图像的图像特征；将所述训练样本集中每一样本图像的图像特征发送至所述服务器，以使所述服务器根据所述全局图像检测模型的参数和所述训练样本集中每一样本图像的图像特征，计算得到所述全局图像检测模型的注意力分布；接收所述服务器发送的所述全局图像检测模型的注意力分布。3.根据权利要求2所述的方法，其特征在于，所述获取所述训练样本集中每一样本图像的图像特征，包括：针对所述训练样本集中的每一样本图像，将所述样本图像裁剪为多张包括组织区域的图像块；提取每张所述图像块的图像特征；将多张所述图像块的图像特征聚合，得到所述样本图像的图像特征。4.根据权利要求3所述的方法，其特征在于，所述将所述样本图像裁剪为多张包括组织区域的图像块，包括：使用目标算法，对所述样本图像进行背景区域去除处理，得到处理后的样本图像；按照预设剪裁方法，将所述处理后的样本图像剪裁为多张包括组织区域的图像块，使得所述图像块的尺寸为预设尺寸，且所述图像块包括的组织区域与所述图像块面积的比值大于预设值。5.根据权利要求3所述的方法，其特征在于，所述方法还包括：提取每张所述图像块的位置特征，所述图像块的位置特征用于表示所述图像块在所述样本图像中的位置；所述将多张所述图像块的图像特征聚合，得到所述样本图像的图像特征，包括：将多张所述图像块的图像特征和位置特征聚合，得到所述样本图像的图像特征。6.根据权利要求1所述的方法，其特征在于，所述以所述训练样本中的样本图像的图像特征为所述局部图像检测模型的输入，输出所述样本图像的预测分类标签，包括：
以所述训练样本中的样本图像的图像特征为所述局部图像检测模型的输入，通过所述局部图像检测模型将所述样本图像的图像特征压缩为预设维度的图像特征；通过所述局部图像检测模型根据所述预设维度的图像特征，计算所述样本图像的注意力分数，并根据所述训练样本集中的每一样本图像的注意力分数，计算得到所述局部图像检测模型的注意力分布；通过所述局部图像检测模型根据所述局部图像检测模型的注意力分布和所述预设维度的图像特征，确定所述样本图像的预测分类标签并输出。7.根据权利要求1所述的方法，其特征在于，所述根据当前迭代训练过程中的所述样本图像的分类标签、所述样本图像的预测分类标签、所述局部图像检测模型的注意力分布和所述全局图像检测模型的注意力分布，对所述局部图像检测模型的参数进行调整，包括：根据当前迭代训练过程中的所述样本图像的分类标签和所述样本图像的预测分类标签，构建第一损失函数；根据所述局部图像检测模型的注意力分布和所述全局图像检测模型的注意力分布，构建第二损失函数；根据所述第一损失函数和所述第二损失函数构建目标损失函数；根据所述目标损失函数，反向传播调整所述图像检测模型的参数。8.根据权利要求7所述的方法，其特征在于，所述根据所述局部图像检测模型的注意力分布和所述全局图像检测模型的注意力分布，构建第二损失函数，包括：基于所述局部图像检测模型的注意力分布和所述全局图像检测模型的注意力分布之间的相似性，构建所述第二损失函数，所述第二损失函数随着所述相似性的增大而减小。9.根据权利要求1所述的方法，其特征在于，所述将所述当前迭代训练过程的模型参数发送至所述服务器，包括：通过噪声生成器生成随机噪声，所述随机噪声小于或等于预设阈值；将所述当前迭代训练过程的模型参数添加所述随机噪声后发送至所述服务器。10.一种图像检测模型训练方法，其特征在于，包括：在任一次迭代训练过程中，获取N个客户端中每个客户端对应的全局图像检测模型的注意力分布，其中，一个客户端对应的所述全局图像检测模型的注意力分布根据所述全局图像检测模型的参数和所述一个客户端当前迭代训练过程使用的训练样本集中每一样本图像的图像特征确定，所述N为正整数；向目标客户端发送所述目标客户端对应的全局图像检测模型的注意力分布...

【专利技术属性】
技术研发人员：孔飞，项进喜，杨森，张军，韩骁，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人