一种基于恶意样本净化的模型测试时自适应方法及其系统技术方案

技术编号:46591987 阅读:2 留言:0更新日期:2025-10-10 21:25
本发明专利技术属于计算机视觉相关技术领域,其公开了一种基于恶意样本净化的模型测试时自适应方法及其系统,方法包括:将当前样本批次分为良性样本和恶意样本;计算每个样本的显著性指标;确定当前样本批次中的待净化样本,待净化样本包括恶意样本;针对每个待净化样本,选择与之显著性距离最大的良性样本作为配对样本,利用图像融合技术对待净化样本及其配对样本进行融合,生成净化样本及其模型预测概率的伪标签;结合当前样本批次和所得的净化样本,以最小化总损失函数为优化目标对当前待优化模型进行参数优化。通过本发明专利技术方案,可以提高测试数据的利用率,由此可以通过采集更少的测试数据便能实现较好的模型参数优化效果。

【技术实现步骤摘要】

本专利技术属于计算机视觉相关,更具体地,涉及一种基于恶意样本净化的模型测试时自适应方法及其系统


技术介绍

1、当利用本地训练数据预训练机器学习模型之后,将其部署至真实世界(测试环境)进行实际测试应用时,由于像噪声、图像模糊、数字压缩、天气和光照条件等因素的影响,会导致测试环境下的测试数据与前期预训练的训练数据的数据分布存在分布偏移,导致机器学习模型在测试环境下的预测性能显著下降,模型测试时自适应方法旨在利用未标记的测试样本实时优化预训练模型的参数,实现参数微调,使其快速适应动态变化的测试环境,从而提升模型在真实场景中的泛化性能。

2、为保证较好的优化效果,现有研究通常采用样本选择策略,通过设计样本筛选标准(如模型输出的条件熵、模型预测的概率以及模型对增强样本的预测不变性)区分“良性”与“恶意”样本,侧重利用良性样本进行模型测试时自适应。例如,在中国专利技术专利说明书cn119360123a中公开了一种基于伪标签概率差异分数的样本筛选方法,将筛选出良性样本后输入能量模型,结合能量优化目标构建联合优化目标。又例如,在中国专利技术专利说明书cn11本文档来自技高网...

【技术保护点】

1.一种基于恶意样本净化的模型测试时自适应方法,其特征在于,包括:

2.如权利要求1所述的模型测试时自适应方法,其特征在于,划分良性样本和恶意样本的方法包括:将当前样本批次中的每个样本输入当前待优化模型进行预测,根据预测结果的置信度指标,将当前样本批次划分为良性样本和恶意样本。

3.如权利要求1所述的模型测试时自适应方法,其特征在于,所述显著性指标为图像像素级显著性指标、数据特征级显著性指标、模型输出级显著性指标中的任一种,或者以上多种的叠加;

4.如权利要求1所述的模型测试时自适应方法,其特征在于,所述数据库为共享数据库,每个测试步均从相同的内存库中...

【技术特征摘要】

1.一种基于恶意样本净化的模型测试时自适应方法,其特征在于,包括:

2.如权利要求1所述的模型测试时自适应方法,其特征在于,划分良性样本和恶意样本的方法包括:将当前样本批次中的每个样本输入当前待优化模型进行预测,根据预测结果的置信度指标,将当前样本批次划分为良性样本和恶意样本。

3.如权利要求1所述的模型测试时自适应方法,其特征在于,所述显著性指标为图像像素级显著性指标、数据特征级显著性指标、模型输出级显著性指标中的任一种,或者以上多种的叠加;

4.如权利要求1所述的模型测试时自适应方法,其特征在于,所述数据库为共享数据库,每个测试步均从相同的内存库中选择进行配对的良性样本,每个测试步均从相同的内存库中选择进行配对的良性样本,或者,所述内存库为临时内存库,所述临时内存库中仅临时存储当前测试步中的良性样本并在当前测试步结束时被删除,不同测试步对应不同的临时内存库,每个测试...

【专利技术属性】
技术研发人员:项翔马靖李瀚林
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1