【技术实现步骤摘要】
一种基于RGBD图像的目标检测方法、装置及计算机设备
本专利技术涉及深度学习和目标检测
,特别涉及一种基于RGBD图像的目标检测方法、装置及计算机设备。
技术介绍
为顺应智能零售的时代潮流,无人店项目将线下零售和人工智能相结合,提供一种和线上购物一样流畅的全新购物方式。系统通过全覆盖式拍摄进店的每一个顾客的行为轨迹,实时提供商品推荐和结算等服务,真正意义上做到即拿即走的无感知购物体验。目前的目标检测算法及其使用的数据增强方法都仅使用RGB图像数据,尽管通过利用传统数据增强方法数据获取方便,设备成本较低,但存在信息量不足的问题,容易造成误检与漏检,进而影响到目标检测算法的准确度,甚至导致整体系统无法正常运行从而影响出店结算。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种基于RGBD图像的目标检测方法、装置及计算机设备,通过对RGBD图像设置相应数据增强方法扩充训练数据,以及针对RGBD图像的自适应归一化方法和过滤处理等操作,减少了误检、漏检现象,能够准确高效地获取目标检测结 ...
【技术保护点】
1.一种基于RGBD图像的目标检测方法,其特征在于,所述方法包括:/n获取RGB图像与对应深度图像;/n对所述RGB图像、所述深度图像分别进行数据预处理,所述数据预处理至少包括自适应归一化操作;/n将数据预处理后的RGB图像与深度图像对齐合并成RGBD图像;/n将所述RGBD图像输入预设深度学习模型,获得至少包括待测目标和待测目标组件的初步候选框;/n对所述初步候选框进行阈值过滤、NMS过滤和深度信息过滤,获得输出框;/n根据所述输出框确定所述待测目标组件与所述待测目标的目标关联关系,根据所述目标关联关系获得目标检测结果。/n
【技术特征摘要】
1.一种基于RGBD图像的目标检测方法,其特征在于,所述方法包括:
获取RGB图像与对应深度图像;
对所述RGB图像、所述深度图像分别进行数据预处理,所述数据预处理至少包括自适应归一化操作;
将数据预处理后的RGB图像与深度图像对齐合并成RGBD图像;
将所述RGBD图像输入预设深度学习模型,获得至少包括待测目标和待测目标组件的初步候选框;
对所述初步候选框进行阈值过滤、NMS过滤和深度信息过滤,获得输出框;
根据所述输出框确定所述待测目标组件与所述待测目标的目标关联关系,根据所述目标关联关系获得目标检测结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取无目标场景下的深度图像,计算所述自适应归一化操作所需参数和所述深度信息过滤所需参数。
3.根据权利要求2所述的方法,其特征在于,获取无目标场景下的深度图像,计算所述自适应归一化操作所需参数和所述深度信息过滤所需参数,包括:
采集N张深度图像,取其非零中位数合并为一张深度图并去噪,然后在所述深度图中指定一部分地面区域,由区域生长法获得地面蒙版并去噪,再由去噪后的地面蒙版与去噪后的深度图计算得到不同地面区域深度图,计算所述不同地面区域深度图中非零区域的均值。
4.根据权利要求1至3任一项所述的方法,其特征在于,对所述RGB图像、所述深度图像分别进行数据预处理,包括:
将所述RGB图像、所述深度图像分别补零到预设图片比例;
再分别缩放到预设输入尺寸;
最后分别进行所述自适应归一化操作。
5.根据权利要求1至3任一项所述的方法,其特征在于,在将所述RGBD图像输入预设深度学习模型,获得至少包括待测目标和待测目标组件的初步候选框之前,所述方法还包括:
对采集的RGBD图像训练数据进行数据增强操作,并训练得到所述预设深度学习模型,其中所述数据增强操作至少包括以下方式的一种:
对RGBD图像进行随机旋转、缩放、翻转、平移中的至少一种操作;
对深度图像,进行高斯噪声处理和/或随机像素置零;
对RGB图像,进行高斯噪声处理。
6.根据权利要求...
【专利技术属性】
技术研发人员:唐诗尧,汪明明,冀怀远,
申请(专利权)人:苏宁云计算有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。