一种模型训练、图像识别方法、装置、设备及存储介质制造方法及图纸

技术编号：39002436 阅读：10 留言：0更新日期：2023-10-07 10:34

本说明书公开了一种模型训练、图像识别方法、装置、设备及存储介质，用于隐私保护，可以通过将样本图像属于每个父类别的概率值和样本图像属于每个类别下的子类别的概率值之间的偏差为约束条件，以使图像识别模型输出的样本图像属于任意一个父类别的概率值和图像识别模型输出的样本图像属于这个父类别下的子类别的概率值保持一致，从而使得在对图像识别模型进行训练过程中，可以在使用细粒度的各样本图像对图像识别模型进行训练的同时，使用部分粗粒度的样本图像对图像识别模型进行训练，进而可以在给定的数量有限的细粒度样本图像的基础上，提升图像识别模型的训练效果。提升图像识别模型的训练效果。提升图像识别模型的训练效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练、图像识别方法、装置、设备及存储介质

[0001]本说明书涉及图像识别
，尤其涉及一种模型训练、图像识别方法、装置、设备及存储介质。

技术介绍

[0002]随着机器学习技术的发展，图像识别模型在各个领域中都得到了广泛的应用，而在对图像识别模型进行训练的过程中，常用的训练方法为有监督训练，在有监督训练过程中需要根据图像识别模型的识别粒度(例如：粗粒度的动物种类识别，如：猫、狗等、细粒度的动物的品种识别，如：哈士奇、金毛等)，构建与该识别粒度相匹配的标注数据以用于对图像识别模型进行训练。
[0003]其中，用于训练图像识别模型的细粒度的标注数据的获取较为困难，例如：细粒度的图片标注需要对图片的质量以及标注人员所掌握的背景知识有着较高的要求，从而导致获取到的用于训练图像识别模型的细粒度的标注数据的数量有限，进而使得图像识别模型的训练效果较差。

技术实现思路

[0004]本说明书提供一种模型训练、图像识别方法、装置、设备及存储介质，以部分的解决现有技术存在的问题。
[0005]本说明书采用下述技术方案：
[0006]本说明书提供了模型训练方法，所述方法包括：
[0007]获取样本图像；
[0008]将所述样本图像输入到图像识别模型中，以通过所述图像识别模型确定所述样本图像属于预设的每个类别的概率值，其中，各类别中包含有按照不同粒度层级划分出的父类别和子类别；
[0009]针对每个父类别，根据所述样本图像属于该父类别的概率值和所述样本图像属于该父...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，所述方法包括：获取样本图像；将所述样本图像输入到图像识别模型中，以通过所述图像识别模型确定所述样本图像属于预设的每个类别的概率值，其中，各类别中包含有按照不同粒度层级划分出的父类别和子类别；针对每个父类别，根据所述样本图像属于该父类别的概率值和所述样本图像属于该父类别下的子类别的概率值之间的偏差，确定该父类别对应的第一损失；确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练。2.如权利要求1所述的方法，通过所述图像识别模型确定所述样本图像属于每个预设类别的概率值，具体包括：通过所述图像识别模型确定所述样本图像的图像特征；针对每个类别，确定所述图像特征和该类别的初始类别特征之间的关联特征，并通过所述关联特征对所述初始类别特征进行调整，得到所述初始类别特征对应的调整后类别特征；根据所述调整后类别特征，确定所述样本图像属于所述调整后类别特征对应的类别的概率值。3.如权利要求2所述的方法，所述图像识别模型包括：图像特征提取网络、特征交互网络；通过所述图像识别模型确定所述样本图像的图像特征，具体包括：通过所述图像识别模型的所述图像特征提取网络，对所述样本图像进行编码，以确定所述样本图像的图像特征；针对每个类别，确定所述图像特征和该类别的初始类别特征之间的关联特征，并通过所述关联特征对所述初始类别特征进行调整，得到所述初始类别特征对应的调整后类别特征，具体包括：通过所述图像识别模型的所述特征交互网络，针对每个类别，确定所述图像特征和该类别的初始类别特征之间的关联特征，并通过所述关联特征对所述初始类别特征进行调整，得到所述初始类别特征对应的调整后类别特征。4.如权利要求1所述的方法，确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练之前，所述方法还包括：针对每个父类别，根据所述样本图像属于该父类别的概率值和所述样本图像属于该父类别下的子类别的概率值之间的偏差，以及，根据所述样本图像属于该父类别的概率值和所述样本图像属于其他父类别下的子类别的概率值之间的偏差，确定该父类别对应的第二损失；确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练，具体包括：
确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失和各父类别对应的第二损失为优化目标，对所述图像识别模型进行训练。5.如权利要求1或4所述的方法，确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练之前，所述方法还包括：针对每个粒度层级，将所述样本图像在该粒度层级中实际所属的类别，作为目标类别；根据所述样本图像属于所述目标类别的概率值和所述样本图像属于该粒度层级中的其他类别的概率值之间的差值，确定第三损失；确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练，具体包括：确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失和各第三损失为优化目标，对所述图像识别模型进行训练。6.一种图像识别方法...

【专利技术属性】
技术研发人员：陈璟洲，冯健明，武文琦，刘健，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人