一种基于深度学习和视觉算法的图像区域提取与分割方法技术

技术编号:44737807 阅读:24 留言:0更新日期:2025-03-21 18:04
本发明专利技术公开了一种基于深度学习和视觉算法的图像区域提取与分割方法,属于图像处理与分析技术领域,包括以下步骤,SA1、数据采集与数据预处理:收集由用户拍摄的纸张、电脑屏幕以及手机截屏等信息并进行人工排除非上述三类的图片情况,作为原始数据;SA2、构建数据集:通过人工标注多边形前景边缘,然后处理填充为mask作为掩码目标,并联合mask和图片image构建训练集、测试集以及验证集;SA3、建立深度学习模型:构建由边缘提取网络以及深度学习网络组成的深度学习网络DocSegNet,初始化其网络参数;SA4、训练DocSegNet:对整个DocSegNet进行监督训练,取所有测试集与训练集,进行交叉验证的方法进行训练,取其中平均损失最小的网络模型,保存模型。

【技术实现步骤摘要】

本专利技术涉及图像处理与分析,更具体地说,涉及一种基于深度学习和视觉算法的图像区域提取与分割方法


技术介绍

1、目前,传统的图像分割方法,如基于边缘检测、阈值分割和颜色空间变换的算法,在简单背景下可以实现对纸张和显示屏的检测和分割,但在用户拍摄的实际场景中,这些方法通常难以应对复杂情况。例如,在复杂背景下,传统算法可能无法区分纸张或显示屏与其周围环境,导致分割不准确。此外,用户拍摄的显示屏图像中可能存在摩尔纹干扰(即由于相机传感器和显示器像素阵列的相互作用产生的条纹),传统方法在消除这些干扰时效果不佳。

2、另一方面,现有的基于深度学习的分割方法,在处理复杂图像场景时表现较好,特别是在有大量标注数据支持的情况下,能够取得较高的分割精度。然而,这些方法在实际应用中仍然存在一些限制。例如,在用户拍摄包含多个显示屏的图像时,深度学习模型可能难以准确识别出主体屏幕,尤其是在各个屏幕显示内容相似或者屏幕之间有遮挡的情况下。此外,现有方法往往对多角度拍摄的图片处理较差,在屏幕倾斜或发生形变时,分割精度显著下降。

3、因此,现有技术中存在的主要本文档来自技高网...

【技术保护点】

1.一种基于深度学习和视觉算法的图像区域提取与分割方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于深度学习和视觉算法的图像区域提取与分割方法,其特征在于,所述SA3步骤中模型的输入为H*W*3,输出为H*W*1。

3.根据权利要求1所述的一种基于深度学习和视觉算法的图像区域提取与分割方法,其特征在于,所述模型的网络层层次结构设计包括以下步骤:

4.根据权利要求3所述的一种基于深度学习和视觉算法的图像区域提取与分割方法,其特征在于,所述边缘信息编码包括以下步骤:

5.根据权利要求3所述的一种基于深度学习和视觉算法的图像区域提...

【技术特征摘要】

1.一种基于深度学习和视觉算法的图像区域提取与分割方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于深度学习和视觉算法的图像区域提取与分割方法,其特征在于,所述sa3步骤中模型的输入为h*w*3,输出为h*w*1。

3.根据权利要求1所述的一种基于深度学习和视觉算法的图像区域提取与分割方法,其特征在于,所述模型的网络层层次结构设计包括以下步骤:

4.根据权利要求3所述的一种基于深度学习和视觉算法的图像区域提取与分割方法,其特征在于,所述边缘信息编码包括以下步骤:

<...

【专利技术属性】
技术研发人员:张昶姜博怀
申请(专利权)人:成都哈瑞特医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1