模型训练方法、装置及电子设备制造方法及图纸

技术编号：38476427 阅读：8 留言：0更新日期：2023-08-15 16:56

本公开提供了模型训练方法，涉及图像处理、深度学习等技术领域。具体方案：获取包括样本图像及样本图像的至少一个第一标注标签的第一数据集、待修正的多标签分类模型支持分类的多个目标类别中的至少一个第一类别后，基于预设的转换规则及第一标注标签，确定样本图像在第一类别下的第二标注标签，并确定样本图像在目标类别中除第一类别外的其它类别下的第二标注标签为第一预设标签，之后，利用样本图像及样本图像在目标类别下的第二标注标签，对待修正的多标签分类模型进行训练，以获取多标签分类模型。从而提高了训练多标签分类模型的准确性与效率。准确性与效率。准确性与效率。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置及电子设备

[0001]本公开涉及人工智能
，尤其涉及图像处理、深度学习等
，具体涉及模型训练方法、装置及电子设备。

技术介绍

[0002]在训练单标签分类模型时，训练数据集的样本图片中一般只标出一种或几种类别(如人、动物、食物等)，忽略样本图片中存在的其他类别。在训练多标签分类模型时，需要人工重新对训练数据进行整理，标注出多标签分类模型对应的全部类别，导致模型训练成本高，训练周期较长。

技术实现思路

[0003]本公开提供了一种模型训练方法、装置及电子设备。
[0004]根据本公开的一方面，提供了一种模型训练方法，包括：
[0005]获取第一数据集、待修正的多标签分类模型支持分类的多个目标类别中的至少一个第一类别，其中，第一数据集中包括样本图像及样本图像的至少一个第一标注标签；
[0006]基于预设的转换规则及第一标注标签，确定样本图像在第一类别下的第二标注标签；
[0007]确定样本图像在目标类别中除第一类别外的其它类别下的第二标注标签为第一预设标签；
[0008]利用样本图像及样本图像在目标类别下的第二标注标签，对待修正的多标签分类模型进行训练，以获取多标签分类模型。
[0009]根据本公开的另一方面，提供了一种模型训练装置，包括：
[0010]获取模块，用于获取第一数据集、待修正的多标签分类模型支持分类的多个目标类别中的至少一个第一类别，其中，第一数据集中包括样本图像及样本图像的至少一个第一标注标签；
>[0011]确定模块，用于基于预设的转换规则及第一标注标签，确定样本图像在第一类别下的第二标注标签；
[0012]上述确定模块，用于确定样本图像在目标类别中除第一类别外的其它类别下的第二标注标签为第一预设标签；
[0013]训练模块，用于利用样本图像及样本图像在目标类别下的第二标注标签，对待修正的多标签分类模型进行训练，以获取多标签分类模型。
[0014]根据本公开的另一方面，提供了一种电子设备，包括：
[0015]至少一个处理器；以及
[0016]与至少一个处理器通信连接的存储器；其中，
[0017]存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述实施例的方法。
[0018]根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行根据上述实施例的方法。
[0019]应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用于更好地理解本方案，不构成对本公开的限定。其中：
[0021]图1为本公开实施例提供的一种模型训练方法的流程示意图；
[0022]图2为本公开实施例提供的另一种模型训练方法的流程示意图；
[0023]图3为本公开实施例提供的另一种模型训练方法的流程示意图；
[0024]图4为本公开实施例提供的另一种模型训练方法的流程示意图；
[0025]图5为本公开实施例提供的另一种模型训练装置的结构示意图；
[0026]图6是用来实现本公开实施例的模型训练的电子设备的框图。
具体实施方式
[0027]以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
[0028]人工智能，是研究使用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的
也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术包括计算机视觉技术、语音识别技术、自然语言处理技术以及深度学习、大数据处理技术、知识图谱技术等几大方向。
[0029]下面参考附图，对本公开实施例的模型训练方法、装置、电子设备和存储介质进行详细说明。
[0030]需要说明的是，本公开实施的模型训练方法被配置于模型训练装置(以下简称为训练装置)中来举例说明，确定装置可以应用于任一电子设备中，以使该电子设备可以执行训练模型的功能。
[0031]其中，电子设备可以为任一具有计算能力的设备，例如可以为个人电脑(Personal Computer，简称PC)、移动终端等，移动终端例如可以为手机、平板电脑、个人数字助理、穿戴式设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
[0032]图1为本公开实施例提供的一种模型训练方法的流程示意图。
[0033]如图1所示，该方法包括：
[0034]步骤101，获取第一数据集、待修正的多标签分类模型支持分类的多个目标类别中的至少一个第一类别，其中，第一数据集中包括样本图像及样本图像的至少一个第一标注标签。
[0035]其中，第一类别为待修正的多标签分类模型对应的分类准确性较低的类别，可以在系统中预先设置第一类别。
[0036]本公开中，多标签分类模型可以用于确定图像中是否包含多个目标类别下的对象。比如，多标签分类模型可以用于确定图像中是否包含人、动物等。通常多标签分类模型支持分类的目标类别较多，而训练获得的多标签分类模型可能在某一目标类别下分类的准确性较低。可以继续利用样本图像对该多标签分类模型进行训练(即修正)，以提高多标签分类模型在全部目标类别下分类的准确性。
[0037]本公开中，第一数据集中样本图像的标签标注方式和多标签分类模型对应样本图像的标签标注方式不同，且第一数据集中样本图像未标出在全部目标类别下的标注标签。当用第一数据集对多标签分类模型进行训练时，需要确定第一数据集中的各样本图像在全部目标类别下的标注标签后，才能用第一数据集对多标签分类模型进行训练。
[0038]此外。第一数据集可以包含多个子数据集，每个子数据集中样本图像的标签标注方式可以不同。当第一类别为多个时，第一数据集中的全部样本图像的第一标注标签对应的类别可以包含部分或者全部第一类别。
[0039]步骤102，基于预设的转换规则及第一标注标签，确定样本图像在第一类别下的第二标注标签。
[0040]本公开中，可以预先确定第一数据集中样本图像的第一标注标签与多标签分类模型对应的目标类别间的转换规则。之后，再基于该转换规则，将样本图像的第一标注标签进行转换，确定样本图像在第一类别下的第二标注标签。从而提高了样本图像标注的效率与准确性，进而提高了多标签分类模型的准确性。
[0041]可选的，当第一数据集中包含多个子数据集时，可以基于每个子数据集中样本图像的第一标注标签与多标签本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，包括：获取第一数据集、待修正的多标签分类模型支持分类的多个目标类别中的至少一个第一类别，其中，所述第一数据集中包括样本图像及所述样本图像的至少一个第一标注标签；基于预设的转换规则及所述第一标注标签，确定所述样本图像在所述第一类别下的第二标注标签；确定所述样本图像在所述目标类别中除所述第一类别外的其它类别下的第二标注标签为第一预设标签；利用所述样本图像及所述样本图像在所述目标类别下的第二标注标签，对所述待修正的多标签分类模型进行训练，以获取多标签分类模型。2.如权利要求1所述的方法，其中，所述基于预设的转换规则及所述第一标注标签，确定所述样本图像在所述第一类别下的第二标注标签，包括:在所述第一标注标签为一个，且所述第一数据集中的全部第一标注标签对应与多个第二类别的情况下，当所述样本图像的第一标注标签对应的第二类别与所述第一类别相同时，确定所述样本图像在所述第一类别下的第二标注标签为第二预设标签；在所述样本图像的第一标注标签对应的第二类别与所述第一类别不同的情况下，确定所述样本图像在所述第一类别的第二标注标签为第三预设标签。3.如权利要求1所述的方法，其中，所述基于预设的转换规则及所述第一标注标签，确定所述样本图像在所述第一类别下的第二标注标签，包括:在所述第一标注标签为一个，且所述第一数据集中的全部第一标注标签均对应与同一第一类别的情况下，将所述样本图像的第一标注标签确定为所述样本图像在所述同一第一类别的第二标注标签。4.如权利要求1所述的方法，其中，所述基于预设的转换规则及所述第一标注标签，确定所述样本图像在所述第一类别下的第二标注标签，包括:在所述第一标注标签为多个，且每个所述第一标注标签对应与不同的第二类别的情况下，将每个所述第二类别与所述第一类别进行匹配，从所述样本图像的多个所述第一标注标签中确定出所述样本图像在所述第一类别下的第二标注标签。5.如权利要求1
‑
4任一所述的方法，其中，所述利用所述样本图像及所述样本图像在所述目标类别下的第二标注标签，对所述待修正的多标签分类模型进行训练，以获取多标签分类模型，包括：将所述样本图片输入所述待修正的多标签分类模型，获取所述待修正的多标签分类模型输出的每个所述目标类别下的第二标注标签的第二置信度；在任一目标类别对应的第二标注标签不为第一预设标签的情况下，将所述任一目标类别确定为有效类别；根据所述有效类别下的第二标注标签及所述有效类别对应的第二置信度，确定损失值，以根据所述损失值对所述待修正的多标签分类模型进行修正。6.如权利要求5所述的方法，其中，在所述根据所述损失值对所述待修正的多标签分类模型进行修正之后，还包括:在所述样本图像在任一第一类别对应的标注标签不为所述第一预设标签的情况下，更新所述任一第一类别对应的样本数量；
在每个所述第一类别对应的样本数量均大于第二阈值的情况下，将最后一次修正后的多标签分类模型，确定为最终的多标签分类模型。7.一种模型训练装置，包括：获取模块，用于获取第一数据集、待修正的多标签分类模型支持分类的多个目标类别中的至少一个第一类别，其中，所...

【专利技术属性】
技术研发人员：曹超，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人