【技术实现步骤摘要】
本专利技术涉及机器视觉,具体而言,涉及一种适用于非结构环境的ai异构立体视觉目标检测方法和系统。
技术介绍
1、人工智能技术作为一种新兴的技术类型,已然成为当今社会发展的重要驱动力,其中,计算机视觉作为人工智能领域的一个分支,应用非常广泛,包括图像处理、机器学习、深度学习等领域。计算机视觉就是使用计算机或者摄像头等设备来模拟生物视觉,通过采集周围环境图像或视频信息,来识别测量相应场景下的三维信息。其研究目标是使计算机能够识别、理解和控制现实世界中的图像、视频和其它数据信息,为计算机和机器人研究开发出可以与人类比肩的视觉分析能力,让计算机或者机器人拥有视觉和大脑,能够像人一样准确感知周围环境。早期的计算机视觉技术是通过单目相机对目标物进行识别测量,通过分析和处理单个相机采集的图像信息,实现目标物识别的功能,单目视觉可以完成目标物识别,但会存在较大的测量误差且无法消除相机角度带来的干扰,导致丢失部分目标物的深度信息,无法获取目标物位置信息,随着计算机技术的不断发展以及应用需求的不断提高,单目视觉的识别精度已经无法满足实际应用需求。由此产生由
...【技术保护点】
1.一种适用于非结构环境的AI异构立体视觉目标检测方法,其特征在于,包括:
2.根据权利要求1所述的适用于非结构环境的AI异构立体视觉目标检测方法,其特征在于,所述YOLOv5模型包括:输入端、主干网络、颈网络以及预测端;其中,所述输入端采用Mosaic数据增强算法对训练集图像进行处理;所述主干网络以Focus网络为基础结合CSPDarknet53骨干网络,通过CSPDarknet53提取特征信息,通过Focus网络进行切片,将输入的图像转为多层特征图,以增强模型对特征信息的提取能力;所述颈网络位于所述主干网络和所述预测端之间,通过FPN-PAN结构,将所
...【技术特征摘要】
1.一种适用于非结构环境的ai异构立体视觉目标检测方法,其特征在于,包括:
2.根据权利要求1所述的适用于非结构环境的ai异构立体视觉目标检测方法,其特征在于,所述yolov5模型包括:输入端、主干网络、颈网络以及预测端;其中,所述输入端采用mosaic数据增强算法对训练集图像进行处理;所述主干网络以focus网络为基础结合cspdarknet53骨干网络,通过cspdarknet53提取特征信息,通过focus网络进行切片,将输入的图像转为多层特征图,以增强模型对特征信息的提取能力;所述颈网络位于所述主干网络和所述预测端之间,通过fpn-pan结构,将所述主干网络中获得的特征信息进行多尺度特征融合处理;所述预测端用于对目标物进行位置和分类预测,针对不同尺度的目标,预测端选用相对应的检测模块进行特征图预测,然后计算特征图中可能存在目标的位置、类别以及置信度信息,在得到预测结果之后,根据预测框的置信度和类别置信度信息,判断是否为目标物并进行筛选,最终筛选重复预测框后输出检测到的目标物信息。
3.根据权利要求1所述的适用于非结构环境的ai异构立体视觉目标检...
【专利技术属性】
技术研发人员:邓三鹏,游翔,李辉,祁宇明,曹宇聪,马传庆,
申请(专利权)人:扬州博诺智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。