一种基于多核特征融合卷积神经网络的行人图像增强方法、装置和介质制造方法及图纸

技术编号:43871810 阅读:20 留言:0更新日期:2024-12-31 18:56
本发明专利技术提供了一种基于多核特征融合卷积神经网络的行人图像增强方法、装置和介质,属于计算机视觉技术领域。所述方法包括:采集在恶劣天气条件和遮挡条件下拍摄的行人图像作为原始图像数据集,并对原始图像数据集进行标记,作为训练数据集;建立基于多核特征融合卷积神经网络的行人图像增强模型;通过训练集训练行人图像增强模型,将所述训练数据集输入到所述神经网络模型中,采用监督学习的方式训练该网络,直至满足训练终止条件;将训练好的行人图像增强模型部署到目标检测网络的前端,增强目标检测网络的输入图像。本发明专利技术提高了行人成像的清晰度和识别准确性,提高了模型的泛化能力和鲁棒性。

【技术实现步骤摘要】

本专利技术涉及一种基于多核特征融合卷积神经网络的行人图像增强方法、装置和介质,属于计算机视觉。


技术介绍

1、随着人工智能和计算机视觉技术的快速发展,行人识别技术在智能监控、自动驾驶、智能城市等领域得到了广泛的应用。行人识别旨在通过分析图像或视频中的行人特征,实现对特定个体的检测和识别。传统的行人识别方法通常依赖于手工设计的特征,如边缘、纹理、颜色等,这些方法在简单场景下表现良好,但在复杂环境中(如光照变化、遮挡、雾天、雨天)难以取得令人满意的效果。

2、近年来,卷积神经网络(cnn)的兴起为行人识别带来了革命性的变化。通过自动学习图像中的多层次特征,cnn在行人检测和识别方面取得了显著进展。行人识别通常会受到不同光照条件以及复杂背景环境的影响。传统的cnn难以适应这些变化,尤其是在光照条件变化剧烈时,模型的稳定性和准确性会显著降低。在实际应用场景中,行人经常会被部分遮挡(如由车辆、物体或其他行人遮挡)。传统cnn通常无法有效处理这种部分可见的情况,尤其是无法从非遮挡部分提取足够的有用特征,导致识别准确性下降。尽管cnn在行人识别中表现出了很高本文档来自技高网...

【技术保护点】

1.一种基于多核特征融合卷积神经网络的行人图像增强方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的基于多核特征融合卷积神经网络的行人图像增强方法,其特征在于,所述原始图像数据集包括RainyCityscapes数据集、Foggy Zurich数据集。

3.根据权利要求1所述的基于多核特征融合卷积神经网络的行人图像增强方法,其特征在于,所述基于多核特征融合卷积神经网络的行人图像增强模型多核池化层和多核卷积层窗口尺度均包括3x3、5x5和7x7;所述多核池化层包括平均池化和最大池化。

4.根据权利要求3所述的基于多核特征融合卷积神经网络的...

【技术特征摘要】

1.一种基于多核特征融合卷积神经网络的行人图像增强方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的基于多核特征融合卷积神经网络的行人图像增强方法,其特征在于,所述原始图像数据集包括rainycityscapes数据集、foggy zurich数据集。

3.根据权利要求1所述的基于多核特征融合卷积神经网络的行人图像增强方法,其特征在于,所述基于多核特征融合卷积神经网络的行人图像增强模型多核池化层和多核卷积层窗口尺度均包括3x3、5x5和7x7;所述多核池化层包括平均池化和最大池化。

4.根据权利要求3所述的基于多核特征融合卷积神经网络的行人图像增强方法,其特征在于,所述行人图像增强模型对图像处理方法如下:

5.根据权利要求4所述的基于多核特征融合卷积神经网络的行人图像增强方法,其特征在于,所述通道卷积层中每个通道都有一个独立的卷积核,所述卷积核分别与输入图像的对应通道进行卷积操作;计算过程如下:

【专利技术属性】
技术研发人员:陈海波
申请(专利权)人:山东浪潮数字服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1