基于领域翻转的机器人巡航目标识别方法及系统技术方案

技术编号:29704814 阅读:14 留言:0更新日期:2021-08-17 14:33
本发明专利技术公开了一种基于领域翻转的机器人巡航目标识别方法及系统,其首先根据源域数据和目标域数据训练得到域自适应模型,然后利用域自适应模型对目标域数据进行训练,并使用噪声学习方法挑选得到目标域可信样本,接着将目标域可信样本作为源域数据,将源域数据作为目标域数据对域自适应模型进行训练,最后不断迭代优化,直至自适应模型学到最优的域不变特征。本发明专利技术通过引入噪声学习方法,提高了目标域干净伪标签样本筛选准确率,增加了目标域的可信度;同时通过不停的迭代翻转源域和目标域,可学到最优的域不变表示,从而提升源域的识别率,进而有效的降低机器人巡航的误诊率,提高开放场景的识别效率。

【技术实现步骤摘要】
基于领域翻转的机器人巡航目标识别方法及系统
本专利技术涉及目标识别
,尤其是涉及一种基于领域翻转的机器人巡航目标识别方法及系统。
技术介绍
机器人巡航开放场景下的目标识别是指在机器人巡航的过程中存在分布变化时,实现全自动的目标场景识别。现实世界中很多场所需要配置安防巡逻,保障人民群众的生命以及财产安全,比如学校、大型商场、重要路口、机场、地跌站等等。但是,24h安防巡逻需要耗费巨大的人力物力,安防资源严重不足,且分配不均匀。随着人工智能时代的来临,全智能化的微小物体检测在机器人巡航任务中发挥着较大的作用,不但能够减轻安防人员的负担,减少场所的安保支出,而且还能全方位无死角的检测出安全隐患。机器人巡航开放场景下的目标识别面临的最大困难是现实场景的检测数据具有高度动态性、复杂性、和多变性,各种突发情况在训练数据中很难涵盖,也就是训练数据不可能覆盖一切可能发生的情况,各种不良的对抗攻击策略让安防机器学习系统形同虚设。在实际应用中,同分布假设和相对封闭、静态、可控条件经常不能得到满足。比如,对人脸识别而言,由于光照条件变化、表情变化、采集角度变化(正面、侧面、抬头、低头等)等客观因素的存在,会使得训练样本和测试样本较大程度偏离同分布假设,导致人脸识别系统的泛化性能达不到预期效果。因此,机器人巡航开放场景下的目标识别技术需要满足分布变化时的鲁棒性和泛化性。针对机器人巡航开放场景下分布变化问题,域自适应是有效提升模型或方法的鲁棒性和泛化性的可行途径之一。域自适应的目标是在训练集(源域)和测试集(目标域)概率分布不一致的情况下实现有效学习。近年来,国内外同行已在域自适应的理论和方法上开展了较为深入的研究、取得了较大进展,初步奠定了域自适应方向的研究基础。现有的工作可以分为基于样本、基于特征和基于推理的方法。基于样本的方法侧重于在训练过程中根据单个样本对目标域数据的重要性对其进行加权。基于特征的方法围绕着映射、预测和特征表示,从而使源分类器在目标域上表现良好,而基于推理的方法将适应性纳入参数估计过程,例如通过对优化过程的约束。虽然现有的方法取得了一定的成功,但面临着以下两种缺点:(1)源域识别率不高。虽然域自适应的目标是提升目标域的准确率,但是一味的追求目标域准确率,可能会导致源域的准确率下降;(2)域不变特征的学习能力较弱。域不变特征是克服分布变化的关键,但现有方法不能完全的学习到域不变特征,可能导致模型的泛化性下降。
技术实现思路
本专利技术的目的在于克服上述技术不足,提出一种基于领域翻转的机器人巡航目标识别方法及系统,其能有效的降低机器人巡航的误诊率,提高开放场景的识别效率。为达到上述技术目的,本专利技术的技术方案第一方面提供一种基于领域翻转的机器人巡航目标识别方法,其包括如下步骤:S1、根据源域数据和目标域数据训练得到域自适应模型;S2、利用域自适应模型对目标域数据进行训练,并使用噪声学习方法挑选得到目标域可信样本;S3、将目标域可信样本作为源域数据,将源域数据作为目标域数据对域自适应模型进行训练;S4、迭代优化步骤S1至S3,直至自适应模型学到最优的域不变特征。本专利技术第二方面提供一种基于领域翻转的机器人巡航目标识别系统,其包括如下功能模块:模型建立模块,用于根据源域数据和目标域数据训练得到域自适应模型;可信样本筛选模块,用于利用域自适应模型对目标域数据进行训练,并使用噪声学习方法挑选得到目标域可信样本;反向训练模块,用于将目标域可信样本作为源域数据,将源域数据作为目标域数据对域自适应模型进行训练;迭代优化模块,用于在模型建立模块和反向训练模块之间建立迭代优化回路,通过迭代优化回路对自适应模型进行迭代优化,直至自适应模型学到最优的域不变特征。本专利技术第三方面提供一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种基于领域翻转的机器人巡航目标识别方法的步骤。本专利技术第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于领域翻转的机器人巡航目标识别方法的步骤。与现有技术相比,本专利技术通过引入噪声学习方法,提高了目标域干净伪标签样本筛选准确率,增加了目标域的可信度;同时通过不停的迭代翻转源域和目标域,可学到最优的域不变表示,从而提升源域的识别率,进而有效的降低机器人巡航的误诊率,提高开放场景的识别效率;且具有较强的可移植性、灵活性以及可复制型,在几乎不增加成本的情况下,可以用于大规模的机器巡航开放场景下的目标识别。附图说明图1是本专利技术实施例所述的基于领域翻转的机器人巡航目标识别方法的流程框图。图2是图1中步骤S2的分步骤流程框图。图3是本专利技术实施例所述的基于领域翻转的机器人巡航目标识别系统的模块框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。基于上述内容,本专利技术实施例提供一种基于领域翻转的机器人巡航目标识别方法,如图1所示,其包括如下步骤:S1、根据源域数据和目标域数据训练得到域自适应模型。拟设计一个基于交叉熵损失的深度对抗域自适应模型,用它学习来自不同概率分布和不同类别样本的本质特征,具体采用源域数据和目标域数据对域自适应模型进行训练,通过交叉熵损失训练得到一个源域目标识别效果最优的域自适应模型。所述域自适应模型的结构包括表征学习器,特征提取器、分类器和域判别器等;其中,所述表征学习器用于分别学习源域和目标域的条件信息得到高维特征,所述特征提取器用于自高维特征中抽取源域和目标域的条件性不变特征;所述分类器用于根据不变特征对源域数据进行分类;所述域判别器用于区分输入的高维特征是来自源域的还是来自目标域的,并通过对抗损失来最大化域分类差异,例如假设源域的标签为0,目标域标签为1,最大化域分类误差就是让域判别器分不清源域还是目标域,如此这样,源域和目标域在分布上就变得很齐了,以此初步获得域不变特征。训练过程中,利用源域和目标域数据,同时优化源域风险和分布差异度量。具体的,所述域自适应模型的损失公式如下:式中,1表示指示函数,表示标签为k的样本的损失,表示域自适应模型的输出。所述域自适应模型的特征提取对抗损失的公式如下:式中,表示源域分布;表示目标域分布;表示源域数据采样样本;表示目标域数据采样样本;表示源域样本的判别结果;表示目标域样本的判别结果。所述域自适应模型的最终优化损失为:式中,为均衡参数。S2、利用域自适应模型对目标域数据进行训练,并使用噪声学习方法挑选得到目标域可信样本。噪声学习方法的出发点是基于DNN近期的记忆效应,考虑到深度模型的记忆能力,基本文档来自技高网
...

【技术保护点】
1.一种基于领域翻转的机器人巡航目标识别方法,其特征在于,包括如下步骤:/nS1、根据源域数据和目标域数据训练得到域自适应模型;/nS2、利用域自适应模型对目标域数据进行训练,并使用噪声学习方法挑选得到目标域可信样本;/nS3、将目标域可信样本作为源域数据,将源域数据作为目标域数据对域自适应模型进行训练;/nS4、迭代优化步骤S1至S3, 直至自适应模型学到最优的域不变特征。/n

【技术特征摘要】
1.一种基于领域翻转的机器人巡航目标识别方法,其特征在于,包括如下步骤:
S1、根据源域数据和目标域数据训练得到域自适应模型;
S2、利用域自适应模型对目标域数据进行训练,并使用噪声学习方法挑选得到目标域可信样本;
S3、将目标域可信样本作为源域数据,将源域数据作为目标域数据对域自适应模型进行训练;
S4、迭代优化步骤S1至S3,直至自适应模型学到最优的域不变特征。


2.根据权利要求1所述基于领域翻转的机器人巡航目标识别方法,其特征在于,所述步骤S3包括如下分步骤:
S21、将域自适应模型在目标域上测试,输出目标域样本的伪标签;
S22、将目标域样本的伪标签视为真实标签,重新训练一个目标域模型;
S23、训练目标域样本的同时,收集若干轮每个目标域样本的损失;
S24、计算每个目标域样本的平均损失,并按照从小到大排序;
S25、根据小损失准则,筛选平均损失值较小的部分样本作为可靠样本。


3.根据权利要求2所述基于领域翻转的机器人巡航目标识别方法,其特征在于,所述分步骤S25包括:在目标域模型欠拟合初期,根据小损失准则,筛选平均损失值较小的部分样本作为可靠样本。


4.根据权利要求1所述基于领域翻转的机器人巡航目标识别方法,其特征在于,所述步骤S4包括如下内容:
在迭代优化过程中,采用增量学习策略控制目标域可信样本分布的大小。


5.根据权利要求1所述基于领域翻转的机器人巡航目标识别方法,其特征在于,所述域自适应模型的损失公式如下:



式中,1表示指示函数,表示标签为k的样本的损失,表示域自...

【专利技术属性】
技术研发人员:杨光远韩忠义丁冬睿孔妍张梅玉
申请(专利权)人:广东众聚人工智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1