一种融合轻量级网络与传统图像算法的文档前景识别方法技术

技术编号:46593894 阅读:1 留言:0更新日期:2025-10-10 21:27
本发明专利技术公开了一种融合轻量级网络与传统图像算法的文档前景识别方法,属于数字图像处理技术领域,技术方案包括:构建RGB与Sobel边缘特征融合的四通道输入以增强轮廓感知;采用10层MobileNetV3‑UNet网络实现轻量化特征提取;基于区域生长算法对初始掩码动态优化,设定生长阈值为掩码最大值的7%;训练阶段初期采用二元交叉熵损失函数,当验证集IoU连续5轮提升<0.1%时(定义为瓶颈期),切换至Focal Loss函数;该方法在复杂背景下,模型经FP16量化与50%剪枝后体积由86MB压缩至43MB,训练周期仅需2.1 GPU小时,适用于离线文档处理场景,显著提升复杂背景下的识别精度与效率。

【技术实现步骤摘要】

本专利技术涉及数字图像处理,具体是一种融合轻量级网络与传统图像算法的文档前景识别方法,适用于医疗单据ocr、金融票据识别等离线文档处理场景,尤其适用于复杂背景下的文档前景分割。


技术介绍

1、文档前景识别算法是一种用于从文档图像中区分前景(如文字、线条、图形等)和背景的算法,广泛应用于文档图像处理、光学字符识别(ocr)、文档分析与检索等领域的前处理过程中,其现有技术主要包括以下四类方法:

2、1、阈值分割法(第一代):基于像素灰度值设定固定阈值(如otsu算法),虽计算效率高(平均25ms/帧),但依赖前景与背景的强对比差异。实际应用中,当文档置于木纹桌面、条纹布料等复杂背景时,dibco 2020数据集测试显示错误率26.8%,但在医疗单据在深色背景板拍摄时,其文字区域误判为背景的比例超30%。

3、2、边缘检测法(第二代):采用canny、sobel等算子提取轮廓信息,对规则图形(如表格线)识别效果较好。但存在两大缺陷:

4、噪声敏感性:图像噪点导致伪边缘增生(实测添加高斯噪声σ=0.01时,f1值下降41.2%)本文档来自技高网...

【技术保护点】

1.一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤S1中所述灰度转换的公式为:

3.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤S2中所述MobileNet V3 Encoder采用深度可分离卷积结构,且在编码器层间引入跳跃连接以实现多尺度特征融合。

4.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤S2中第7层编码器的输入由第4层输出和第6层...

【技术特征摘要】

1.一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤s1中所述灰度转换的公式为:

3.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤s2中所述mobilenet v3 encoder采用深度可分离卷积结构,且在编码器层间引入跳跃连接以实现多尺度特征融合。

4.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤s2中第7层编码器的输入由第4层输出和第6层上采样输出拼接形成,第8层输入由第3层输出和第7层上采样输出拼接形成。

5.根据权利要求...

【专利技术属性】
技术研发人员:黄宇翔姜博怀
申请(专利权)人:成都哈瑞特医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1