任务处理方法、装置、电子设备及机器可读存储介质制造方法及图纸

技术编号:37478074 阅读:12 留言:0更新日期:2023-05-07 09:19
本申请提供一种任务处理方法、装置、电子设备及机器可读存储介质,该方法包括:依据当前任务模型对目标域数据在不同数据增强模式下的模型推理结果,确定当前任务模型对目标域数据的推理不确定度;在推理不确定度高于预设阈值的情况下,从目标域数据中选择训练数据,并依据训练数据在不同数据增强模式下的模型推理结果,生成训练数据的伪标签;依据训练数据以及训练数据的伪标签对当前任务模型进行微调训练,得到校准模型;以校准模型为更新后的当前任务模型,并在校准模型对目标域数据的推理不确定度不高于预设阈值的情况下,使用校准模型执行针对目标域数据的模型推理任务。该方法可以有效提高任务模型针对目标域数据的任务处理准确性。任务处理准确性。任务处理准确性。

【技术实现步骤摘要】
任务处理方法、装置、电子设备及机器可读存储介质


[0001]本申请涉及智能处理
,尤其涉及一种任务处理方法、装置、电子设备及机器可读存储介质。

技术介绍

[0002]训练源模型的过程中,模型参数倾向于拟合到源域的训练数据上,因而对源域分布内的测试数据表现良好。然而,当此模型转向使用在其他业务场景时,很大概率会遇到数据偏移的情况,如与源域数据采集的视角不同、照明条件不同、采集设备不同(如不同成像原理、硬件参数、机器老化程度)等差异。因而在新数据分布下,有可能出现许多分布外的样本,源模型的预测将不再可靠,产生性能缺陷,模型任务处理的准确性较低。

技术实现思路

[0003]有鉴于此,本申请提供一种任务处理方法、装置、电子设备及机器可读存储介质,以解决源模型在目标域数据上进行任务处理准确性较低的问题。
[0004]具体地,本申请是通过如下技术方案实现的:
[0005]根据本申请实施例的第一方面,提供一种任务处理方法,包括:
[0006]依据当前任务模型对目标域数据在不同数据增强模式下的模型推理结果,确定所述当前任务模型对所述目标域数据的推理不确定度;
[0007]在所述推理不确定度高于预设阈值的情况下,从所述目标域数据中选择训练数据,并依据所述训练数据在不同数据增强模式下的模型推理结果,生成所述训练数据的伪标签;
[0008]依据所述训练数据以及所述训练数据的伪标签对所述当前任务模型进行微调训练,得到校准模型;
[0009]以所述校准模型为更新后的当前任务模型,并在所述校准模型对目标域数据的推理不确定度不高于所述预设阈值的情况下,使用所述校准模型执行针对目标域数据的模型推理任务。
[0010]根据本申请实施例的第二方面,提供一种任务处理装置,包括:
[0011]确定单元,用于依据当前任务模型对目标域数据在不同数据增强模式下的模型推理结果,确定所述当前任务模型对所述目标域数据的推理不确定度;
[0012]生成单元,用于在所述推理不确定度高于预设阈值的情况下,从所述目标域数据中选择训练数据,并依据所述训练数据在不同数据增强模式下的模型推理结果,生成所述训练数据的伪标签;
[0013]校准单元,用于依据所述训练数据以及所述训练数据的伪标签对所述当前任务模型进行微调训练,得到校准模型;
[0014]处理单元,用于以所述校准模型为更新后的当前任务模型,并在所述校准模型对目标域数据的推理不确定度不高于所述预设阈值的情况下,使用所述校准模型执行针对目
标域数据的模型推理任务。
[0015]根据本申请实施例的第三方面,提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器用于执行机器可执行指令,以实现第一方面提供的方法。
[0016]根据本申请实施例的第四方面,提供一种存储介质,所述存储介质内存储有机器可执行指令,所述机器可执行指令被处理器执行时实现第一方面提供的方法。
[0017]本申请提供的技术方案至少可以带来以下有益效果:
[0018]通过对目标域数据进行不同数据增强处理,并利用当前任务模型对不同数据增强模式下的目标域数据进行模型推理,得到当前任务模型对目标域数据在不同数据增强模式下的模型推理结果,并依据当前任务模型对目标域数据在不同数据增强模式下的模型推理结果,确定当前任务模型对目标域数据的推理不确定度,在该推理不确定度高于预设阈值的情况下,从目标域数据中选择训练数据,并依据所选择的训练数据在不同增强模式下的模型推理结果,生成训练数据的伪标签,依据训练数据以及训练数据的伪标签对当前任务模型进行微调训练,得到校准模型,进而,以校准模型为更新后的当前任务模型,并在校准模型对目标域数据的推理不确定度不高于预设阈值的情况下,使用校准模型执行针对目标域数据的模型推理任务,实现了在缺少源域数据、源域数据对应的标注信息、目标域数据的标注信息的情况下,也可以有效地在目标域数据上,对模型的缺陷进行自动感知,适用于实际场景中无法获取源模型训练数据的情况,并节约了人为标注目标域数据测试集的成本,进而,有效提高了任务模型针对目标域数据的任务处理准确性。
附图说明
[0019]图1是本申请示例性实施例示出的一种任务处理方法的流程示意图;
[0020]图2是本申请示例性实施例示出的一种模型缺陷自动感知和校正实现流程示意图;
[0021]图3是本申请示例性实施例示出的一种模型缺陷感知与代表数据筛选流程示意图;
[0022]图4是一种yolo

v3目标检测模型架构示意图;
[0023]图5是本申请示例性实施例示出的一种任务处理装置的结构示意图;
[0024]图6是本申请示例性实施例示出的一种电子设备的硬件结构示意图。
具体实施方式
[0025]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0026]在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
[0027]为了使本领域技术人员更好地理解本申请实施例提供的技术方案,并使本申请实
施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例中技术方案作进一步详细的说明。
[0028]请参见图1,为本申请实施例提供的一种任务处理方法的流程示意图,如图1所示,该任务处理方法可以包括以下步骤:
[0029]需要说明的是,本申请实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
[0030]步骤S100、依据当前任务模型对目标域数据在不同数据增强模式下的模型推理结果,确定当前任务模型对目标域数据的推理不确定度。
[0031]本申请实施例中,考虑到在一个模型对某数据域有足够的认知能力的情况下,面对做了尺寸变换、翻转等数据增强后的数据,在多个不同预测尺度、翻转形式下,依然可以得到相对稳定的推理结果。而当此模型对某数据域缺乏认知能力的情况下,当数据发生尺度变化和翻转时,模型的推理结果将产生较大的抖动。因此,可以将模型推理结果的抖动程度定义为模型对该数据的不确定性,从而可以通过模型对该域数据的不确定程度(可以称为推理不确定度)作为模型缺陷的评估依据。
[0032]相应地,对于任一目标域,可以确定当前任务模型对目标域数据在不同数据增强模式下的模型推理结果,即分别对目标域数据进行不同数据增强处理,并利用当前任务模型分别对不同数据增强处理后的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种任务处理方法,其特征在于,包括:依据当前任务模型对目标域数据在不同数据增强模式下的模型推理结果,确定所述当前任务模型对所述目标域数据的推理不确定度;在所述推理不确定度高于预设阈值的情况下,从所述目标域数据中选择训练数据,并依据所述训练数据在不同数据增强模式下的模型推理结果,生成所述训练数据的伪标签;依据所述训练数据以及所述训练数据的伪标签对所述当前任务模型进行微调训练,得到校准模型;以所述校准模型为更新后的当前任务模型,并在所述校准模型对目标域数据的推理不确定度不高于所述预设阈值的情况下,使用所述校准模型执行针对目标域数据的模型推理任务。2.根据权利要求1所述的方法,其特征在于,所述依据当前任务模型对目标域数据在不同数据增强模式下的模型推理结果,确定所述当前任务模型对所述目标域数据的推理不确定度,包括:对于任一目标域数据,依据所述当前任务模型对该目标域数据在不同数据增强模式下的模型推理结果,确定该目标域数据的各模型推理结果之间的互信息值;依据各目标域数据对应的互信息值,确定所述当前任务模型对所述目标域数据的推理不确定度。3.根据权利要求1所述的方法,其特征在于,所述从所述目标域数据中选择训练数据,包括:依据所述当前任务模型对各目标域数据的推理不确定度,选择推理不确定度最高的预设比例的目标域数据为训练数据;和/或,利用所述当前任务模型对所述目标域数据进行特征提取,依据提取得到的特征对所述目标域数据进行聚类,得到至少一个聚类簇,并分别从各聚类簇中选择一个或多个目标域数据为训练数据。4.根据权利要求3所述的方法,其特征在于,在训练数据包括从各聚类簇中选择的目标域数据的情况下,对于任一聚类簇,将该聚类簇中特征与该聚类簇的簇平均特征之间的距离最小的目标域数据,确定为训练数据。5.根据权利要求1所述的方法,其特征在于,所述生成所述训练数据的伪标签,包括:对于任一训练数据,确定伪标签生成模型对该训练数据在不同数据增强模式下的模型推理结果;依据伪标签生成模型对该训练数据在不同数据增强模式下的模型推理结果,确定该训练数据的伪标签。6.根据权利要求5所述的方法,其特征在于,初始化状态下,所述伪标签生成模型为初始任务模型;所述依据所述训练数据以及所述训练数据的伪标签对所述当前任务模型进行微调训练,得到校准模型之后,还包括:依据当前伪标签生成模型的模型参数,以及,所述校准模型的模型参数,确定平滑模型参数;
将当前伪标签生成模型的参数更新为所述平滑模型参数,得到更新后的当前伪标签模型参数。7.根据权利要求1所述的方法,其特征在于,所述依据所述训练数据以及所述训练数据的伪标签对所述当前任务模型进行微调训练,包括:在固定所述当前任务模型的非顶层参数的情况下,依据所述训练数据以及所述训练数据的伪标签对所述当前任务模型进行训练;或者,将所述当前任务模型的非顶层的学习率设置为第一学习率,以及,将所述当前任务模型的顶层的学习率设置为第二学习率,并依据所述训练数据以及所述训练数据的伪标签对所述当前任务模型进行训练,所述第一学习率小于所述第二学习率。8.一种任务处理装置,其特征在于,包括:确定单元,用于依据当前任务模型对目标域数据在不同数据增强模式下的模型推理结果,确定所述当前任务模型对所述目标域数据...

【专利技术属性】
技术研发人员:张梦玥任烨郭阶添谭文明
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1