当前位置: 首页 > 专利查询>厦门大学专利>正文

一种基于自适应域学习的弱监督目标定位方法技术

技术编号:38208829 阅读:27 留言:0更新日期:2023-07-21 16:58
一种基于自适应域学习的弱监督目标定位方法,涉计算机视觉技术。模型训练阶段:步骤1,对待检测的图片进行预处理,然后将预处理后待检测的图片及其对应的类别送入神经网络;步骤2,神经网络对图片进行处理,在训练过程中输出待检测图片对应每一个类别的概率数值。模型测试阶段:在测试过程中输出待检测图片预测的框的坐标、类别、得分。ALM诱导网络对抗性地以最大程度生成图片的前景和背景,OLM在此基础上细化前景和背景,获得精细化的物体与背景信息。对于前背景区分效果不理想的图片,RLM提取前景中的关键信息,使网络对其进一步学习。在CUB

【技术实现步骤摘要】
一种基于自适应域学习的弱监督目标定位方法


[0001]本专利技术涉计算机视觉
,尤其是涉及一种基于自适应域学习的弱监督目标定位方法。

技术介绍

[0002]近年来,随着计算机性能的提升和大数据的发展,视觉信息数据迅猛增多,包括静态图像、动态图像、视频文件、音频文件等多媒体数据都以很快的速度在各种社交媒体上传播。目标检测作为计算机视觉领域最基本的问题之一,被广泛应用于目标跟踪、行为理解、人机交互、人脸识别等诸多领域,在20世纪初就吸引众多学者的广泛关注和研究。人类主要通过视觉接收外界信息,所以基于视觉信息的应用技术将是人工智能的一个前瞻性研究点。其中,人脸识别、视频监控、目标检测、互联网图像内容审查、生物特征识别等技术都成为当今的研究热点。这些技术也被广泛应用于医疗、养老、交通、城市运行、安防等领域,例如:医学图像诊断、姿态估计、车站安检、自动驾驶、车速检测、视频监控行为分析等。
[0003]目标定位是计算机视觉和机器学习中极其重要的一个研究领域,融合图像处理、模式识别、人工智能、自动控制等多领域前沿知识。目标定位通常只有一个较大的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于自适应域学习的弱监督目标定位方法,其特征在于包括如下步骤:1)对待检测的图片进行预处理,将预处理后待检测的图片及其对应的图片级别的标签送入神经网络;所述神经网络包括:主干特征提取网络、对抗学习模块ALM、定向学习模块OLM和增强学习模块RLM;2)神经网络对图片进行处理,在训练过程中输出待检测图片对应每一个类别的概率数值;在测试过程中输出待检测图片预测的框的坐标、类别、得分;对抗学习模块ALM诱导网络对抗性地以最大程度生成图片的前景和背景,定向学习模块OLM在此基础上细化前景和背景,获得精细化的物体与背景信息。2.如权利要求1所述一种基于自适应域学习的弱监督目标定位方法,其特征在于在步骤1)中,所述预处理,是先对图片进行标准化处理,再把图片缩放为256
×
256大小,最后随机裁剪为224
×
224大小。3.如权利要求1所述一种基于自适应域学习的弱监督目标定位方法,其特征在于在步骤1)中,所述对抗学习模块ALM一方面用于鼓励激活前景同时抑制背景,另一方面用于控制前景激活的大小,从而诱导网络对抗性地以最大程度生成图片的前景和背景;所述定向学习模块OLM用于在已经生成的前背景上进一步细化,获得更细粒度的物体与背景信息;所述增强学习模块RLM,用于部分前背景区分效果不明显的情况,通过进一步提取前景的关键信息,增强网络的学习效果。4.如权利要求1所述一种基于自适应域学习的弱监督目标定位方法,其特征在于在步骤2)中,所述神经网络对图片进行处理,包括如下步骤:步骤a1,给定带有图像级别标签的数据集集合,将集合划分为训练图片样本集和测试图片样本集;步骤a2,从训练图片样本集中任意选取图像I,将该图像I,以及其对应的图像级别的标签y输入神经网络的浅层特征提取主干网络得到网络关于图像浅层特征的输出步骤a3,浅层特征经过生成器网络,得到前景预测图X
fpm
;步骤a4,根据标签y确定该图像对应类的前景预测图M
fpm
,并对其进行取反操作得到对应的背景预测图M
bpm
;步骤a5,浅层特征继续经过神经网络的深层特征提取主干网络获得图像特征通过全局平均池化得到图像分类损失同时,通过与M...

【专利技术属性】
技术研发人员:曹刘娟陈志威王思伟
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1