基于人工智能的政府政务文档智能识别方法及系统技术方案

技术编号:46570527 阅读:1 留言:0更新日期:2025-10-10 21:17
本发明专利技术涉及图像处理技术领域,尤其涉及基于人工智能的政府政务文档智能识别方法及系统。方法包括步骤:采集政务文档灰度图像,并获取窗口最大纵向尺寸以及窗口最大横向尺寸,根据像素点的灰度特征以及梯度特征,对所述窗口最大纵向尺寸以及窗口最大横向尺寸调整,获取每个像素点的窗口横向尺寸以及窗口纵向尺寸,并构建每个像素点的窗口;根据像素点的窗口的灰度均值与图像的灰度均值的差异,获取每个像素点的标准差系数;基于所述标准差系数,获取政务文档灰度图像中每个像素点的二值化阈值,根据所述二值化阈值,对每个像素点进行分割,得到二值化图像,根据二值化图像识别政务文档中的文字,本发明专利技术提高了文字识别的准确性。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及基于人工智能的政府政务文档智能识别方法及系统


技术介绍

1、政府部门通常会处理大量的公文、报表以及申请材料等政务文档,这些文档中包含了丰富的信息,对政府的日常运营、决策过程以及政策执行等方面起着重要作用,因此为了便于政务文档的查询,以及政务文档的长期存储,通常以政务文档数字化的方式对政务文档进行处理,在政务文档数字化过程中需要对文档进行识别;

2、为了便于文档图像内文字的识别,通常需要对文档图像进行二值化处理,通常可通过niblack算法进行图像的二值化处理,而传统的niblack算法对图像进行二值化处理时,根据每个像素点的窗口内的灰度均值以及标准差来确定每个像素点的二值化阈值,后续根据每个像素点的二值化阈值对每个像素点进行分割。

3、如果某个像素点的窗口中仅包含背景区域中,那么背景区域的灰度值可能会被算法误分为两类(背景区域或字符区域),从而导致二值化结果中图像的背景区域产生大量斑点状的伪字符,干扰了对政务文档的识别,如果某个像素点的窗口中仅包含字符区域,那么字符区域的灰度值可能也会被算法误分为两本文档来自技高网...

【技术保护点】

1.基于人工智能的政府政务文档智能识别方法,其特征在于,包括:

2.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取窗口最大纵向尺寸,包括:

3.根据权利要求1或2所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取窗口最大横向尺寸,包括:

4.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取政务文档灰度图像中每个像素点的窗口横向尺寸以及窗口纵向尺寸,包括:

5.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取政务文档灰度图像中每个...

【技术特征摘要】

1.基于人工智能的政府政务文档智能识别方法,其特征在于,包括:

2.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取窗口最大纵向尺寸,包括:

3.根据权利要求1或2所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取窗口最大横向尺寸,包括:

4.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取政务文档灰度图像中每个像素点的窗口横向尺寸以及窗口纵向尺寸,包括:

5.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取政务文档灰度图像中每个像素点的标准差系数,包括:

6.根据权利要求5所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取政务文档灰度...

【专利技术属性】
技术研发人员:孙玲孙苗苗徐学平马涛
申请(专利权)人:陕西睿联信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1