【技术实现步骤摘要】
本专利技术涉及数字图像处理,具体是一种融合轻量级网络与传统图像算法的文档前景识别方法,适用于医疗单据ocr、金融票据识别等离线文档处理场景,尤其适用于复杂背景下的文档前景分割。
技术介绍
1、文档前景识别算法是一种用于从文档图像中区分前景(如文字、线条、图形等)和背景的算法,广泛应用于文档图像处理、光学字符识别(ocr)、文档分析与检索等领域的前处理过程中,其现有技术主要包括以下四类方法:
2、1、阈值分割法(第一代):基于像素灰度值设定固定阈值(如otsu算法),虽计算效率高(平均25ms/帧),但依赖前景与背景的强对比差异。实际应用中,当文档置于木纹桌面、条纹布料等复杂背景时,dibco 2020数据集测试显示错误率26.8%,但在医疗单据在深色背景板拍摄时,其文字区域误判为背景的比例超30%。
3、2、边缘检测法(第二代):采用canny、sobel等算子提取轮廓信息,对规则图形(如表格线)识别效果较好。但存在两大缺陷:
4、噪声敏感性:图像噪点导致伪边缘增生(实测添加高斯噪声σ=0.01时,f
...【技术保护点】
1.一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤S1中所述灰度转换的公式为:
3.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤S2中所述MobileNet V3 Encoder采用深度可分离卷积结构,且在编码器层间引入跳跃连接以实现多尺度特征融合。
4.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤S2中第7层编码器的输入
...【技术特征摘要】
1.一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤s1中所述灰度转换的公式为:
3.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤s2中所述mobilenet v3 encoder采用深度可分离卷积结构,且在编码器层间引入跳跃连接以实现多尺度特征融合。
4.根据权利要求1所述的一种融合轻量级网络与传统图像算法的文档前景识别方法,其特征在于:步骤s2中第7层编码器的输入由第4层输出和第6层上采样输出拼接形成,第8层输入由第3层输出和第7层上采样输出拼接形成。
5.根据权利要求...
【专利技术属性】
技术研发人员:黄宇翔,姜博怀,
申请(专利权)人:成都哈瑞特医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。