【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及基于人工智能的政府政务文档智能识别方法及系统。
技术介绍
1、政府部门通常会处理大量的公文、报表以及申请材料等政务文档,这些文档中包含了丰富的信息,对政府的日常运营、决策过程以及政策执行等方面起着重要作用,因此为了便于政务文档的查询,以及政务文档的长期存储,通常以政务文档数字化的方式对政务文档进行处理,在政务文档数字化过程中需要对文档进行识别;
2、为了便于文档图像内文字的识别,通常需要对文档图像进行二值化处理,通常可通过niblack算法进行图像的二值化处理,而传统的niblack算法对图像进行二值化处理时,根据每个像素点的窗口内的灰度均值以及标准差来确定每个像素点的二值化阈值,后续根据每个像素点的二值化阈值对每个像素点进行分割。
3、如果某个像素点的窗口中仅包含背景区域中,那么背景区域的灰度值可能会被算法误分为两类(背景区域或字符区域),从而导致二值化结果中图像的背景区域产生大量斑点状的伪字符,干扰了对政务文档的识别,如果某个像素点的窗口中仅包含字符区域,那么字符区域的灰度值可
...【技术保护点】
1.基于人工智能的政府政务文档智能识别方法,其特征在于,包括:
2.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取窗口最大纵向尺寸,包括:
3.根据权利要求1或2所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取窗口最大横向尺寸,包括:
4.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取政务文档灰度图像中每个像素点的窗口横向尺寸以及窗口纵向尺寸,包括:
5.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取政
...【技术特征摘要】
1.基于人工智能的政府政务文档智能识别方法,其特征在于,包括:
2.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取窗口最大纵向尺寸,包括:
3.根据权利要求1或2所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取窗口最大横向尺寸,包括:
4.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取政务文档灰度图像中每个像素点的窗口横向尺寸以及窗口纵向尺寸,包括:
5.根据权利要求1所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取政务文档灰度图像中每个像素点的标准差系数,包括:
6.根据权利要求5所述的基于人工智能的政府政务文档智能识别方法,其特征在于,所述获取政务文档灰度...
【专利技术属性】
技术研发人员:孙玲,孙苗苗,徐学平,马涛,
申请(专利权)人:陕西睿联信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。