一种电力建设现场签证文档关键内容识别方法及系统技术方案

技术编号:33649998 阅读:18 留言:0更新日期:2022-06-02 20:27
本发明专利技术涉及一种电力建设现场签证文档关键内容识别方法及系统,其中识别方法包括:获取签证文档,并对文档进行预处理;识别图像中的文档文字、表单填写内容和图章;对识别出的文档文字、表单填写内容和图章进行分类整理,并对表单填写内容进行完整性判断;输出识别结果以及完整性判断结果。与现有技术相比,本发明专利技术具有够提高工程文档处理效率和正确率等优点。点。点。

【技术实现步骤摘要】
一种电力建设现场签证文档关键内容识别方法及系统


[0001]本专利技术涉及图像处理
,尤其是涉及一种电力建设现场签证文档关键内容识别方法及系统。

技术介绍

[0002]一般来说,电力工程建设文档包含的关键要素有表单名称、工程建设项目相关企业称谓、工程名称、工程编号、工程项目关键内容、落款签名印章、签名时间等等,十分复杂。而一页PDF中包含的上述要素通常经过多层审批与叠加,为了确保签名与印章的一致性、合法性,往往需要花费大量人力进行核对校验。显然,这种方法很大程度依赖于工作人员的经验,不够准确也容易出现纰漏,在人力有限的情况下很难平衡审批速度与审批准确性。一旦需要大批量整理工程建设文档时就容易出现各种失误。
[0003]为了改进这种通过人力审核整理工程建设文档,就需要将纸质文档电子化,转化为PDF或者图像文件的形式,再通过图像识别、文字识别、印章识别的手段将内容要素整理输出,实现一款图片文档要素识别WEB软件。
[0004]处理图像文件中的字符最常见的技术是OCR光学字符识别技术,光学字符识别技术是指利用电子设备(如扫描仪或数码相机等)对印刷在纸上的字符进行检查,通过检测其明暗图案来确定其形状,然后通过字符识别的方法将其转化为计算机字符的过程。它是一种字符打印技术,利用光学的方法将纸质文件中的文本转换成黑白点阵图像文件,并通过识别软件将图像中的文本转换成文本格式,由文字处理软件进行进一步的编辑和处理。通过这项技术,可以将照相机、扫描仪等光学输入仪器所获取的报纸、书籍、手稿等进行形式转换,将其他印刷的图像信息转换成文本信息,由计算机进行识别和处理。
[0005]OCR技术是过去国内外较多使用的图片文档转换为文字的方式,对于老旧的纸质文档或文献,通常只能由人工的方式拍摄图片再转化为电子文件,处理方式通常为图像去噪、图像预处理、版面分析,对于拍摄质量较差的文档有较强的适应性,同时这类文档的内容通常也较为多变,从金融行业到重工业,都有着较强的文档电子化管理需求。
[0006]深度学习在其中也起着重要的作用,深度学习是一组多层神经网络算法,利用各种机器学习算法来解决图像和文本等各种问题。其核心是特征学习,它将底层特征结合起来,形成更抽象的属性类别或特征的高层表示,从分层网络中获取分层次特征信息,来发现数据的分布式特征表示,从而解决人工特征设计问题。卷积神经网络(CNN)是一种用于深度学习字符识别的神经网络。选择哪种经典网络需要综合考虑,网络训练越深入,最终训练得到的模型就越好,但相应的训练难度会增加,在线部署时预测识别速度会非常慢。

技术实现思路

[0007]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种能够提高工程文档处理效率和正确率的电力建设现场签证文档关键内容识别方法及系统。
[0008]本专利技术的目的可以通过以下技术方案来实现:
[0009]一种电力建设现场签证文档关键内容识别方法,所述的识别方法包括:
[0010]步骤1:获取签证文档,并对文档进行预处理;
[0011]步骤2:识别图像中的文档文字、表单填写内容和图章;
[0012]步骤3:对识别出的文档文字、表单填写内容和图章进行分类整理,并对表单填写内容进行完整性判断;
[0013]步骤4:输出识别结果以及完整性判断结果。
[0014]优选地,所述的步骤1具体为:
[0015]判断文档类型,若文档类型为PDF文档,则将PDF文档进行分页处理,将每一页转换为PNG图像格式保存,若文档类型为图片格式,则统一转换为PNG格式保存。
[0016]优选地,所述的步骤2具体为:
[0017]步骤2

1:利用基于深度学习的OCR模型对文档图片进行文字识别;
[0018]步骤2

2:识别表单填写内容;
[0019]步骤2

3:识别图章内容。
[0020]更加优选地,所述的步骤2

1具体为:
[0021]首先,识别出文字区域,通过滑动窗口算法遍历整个图片,对有监督的标记训练样本特征进行判断,找到目标图片进行矩形化后摘取;
[0022]其次,对文字区域进行矩形分割,在矩形中做一维滑动窗口移动,判断字符间距,对字符进行划分从而将字符拆分;
[0023]然后,根据监督算法对已拆分的字符进行分类预测,不断重复训练,提高模型识别准确率,得到训练好的文字识别模型;
[0024]最后,将步骤1处理的图片作为文字识别模型的输入,即可得到对该文档图片识别的结果。
[0025]更加优选地,所述的步骤2

2具体为:
[0026]首先,对图像进行灰度变换和二值化处理;
[0027]其次,进行横向和纵向膨胀和腐蚀操作,获得横线图和纵线图;
[0028]再次,将横线图和纵线图经过相加运算获得点图,再将点图浓缩为单个像素点;
[0029]从次,对像素点按行遍历,判断这些顶点是否是目标单元格的顶点,全部遍历结束后得到各目标单元格顶点,即可组成矩形框以便分割,完成表格特征的识别和单元格分割;
[0030]最后,对文字区域进行聚焦,并对其进行文字识别,识别出表单填写内容。
[0031]更加优选地,所述的步骤2

3具体为:
[0032]首先,检测圆形边缘,定位圆章中心,并检测圆章半径;
[0033]其次,将文字进行转正,将围绕圆心旋转的文字变为水平排列;
[0034]再次,利用投影分割将文字分割;
[0035]最后,利用CNN网络进行图章文字识别。
[0036]优选地,所述的步骤3具体为:
[0037]步骤3

1:根据识别出的文档内容中的表头文字确定现场签证文档的类型,并将其进行分类整理;
[0038]步骤3

2:分别针对步骤3

1识别出的对应类型的现场签证文档进行表单填写内容完整性识别。
[0039]更加优选地,所述的步骤3

1具体为:
[0040]现场签证文档类型包括现场签证审批单和设计变更审批单,将识别出的文档内容分类为现场签证审批单和设计变更审批单两类。
[0041]更加优选地,所述的步骤3

2具体为:
[0042]判断现场签证审批单或设计变更审批单预设的区域内是否填写有文本内容,若对应区域文本内容为空,则判断该表单内容未填写完整,从而实现表单填写完整性的检查判断。
[0043]一种用于上述电力建设现场签证文档关键内容识别方法的电力建设现场签证文档关键内容识别系统,所述的识别系统包括:
[0044]底层数据库,用于为抓取信息提供存储结构和数据库,同时存储深度学习模型;
[0045]人机交互层,用于为用户进行签证文档上传提供交互平台;
[0046]解释层,用于对签证文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力建设现场签证文档关键内容识别方法,其特征在于,所述的识别方法包括:步骤1:获取签证文档,并对文档进行预处理;步骤2:识别图像中的文档文字、表单填写内容和图章;步骤3:对识别出的文档文字、表单填写内容和图章进行分类整理,并对表单填写内容进行完整性判断;步骤4:输出识别结果以及完整性判断结果。2.根据权利要求1所述的一种电力建设现场签证文档关键内容识别方法,其特征在于,所述的步骤1具体为:判断文档类型,若文档类型为PDF文档,则将PDF文档进行分页处理,将每一页转换为PNG图像格式保存,若文档类型为图片格式,则统一转换为PNG格式保存。3.根据权利要求1所述的一种电力建设现场签证文档关键内容识别方法,其特征在于,所述的步骤2具体为:步骤2

1:利用基于深度学习的OCR模型对文档图片进行文字识别;步骤2

2:识别表单填写内容;步骤2

3:识别图章内容。4.根据权利要求3所述的一种电力建设现场签证文档关键内容识别方法,其特征在于,所述的步骤2

1具体为:首先,识别出文字区域,通过滑动窗口算法遍历整个图片,对有监督的标记训练样本特征进行判断,找到目标图片进行矩形化后摘取;其次,对文字区域进行矩形分割,在矩形中做一维滑动窗口移动,判断字符间距,对字符进行划分从而将字符拆分;然后,根据监督算法对已拆分的字符进行分类预测,不断重复训练,提高模型识别准确率,得到训练好的文字识别模型;最后,将步骤1处理的图片作为文字识别模型的输入,即可得到对该文档图片识别的结果。5.根据权利要求3所述的一种电力建设现场签证文档关键内容识别方法,其特征在于,所述的步骤2

2具体为:首先,对图像进行灰度变换和二值化处理;其次,进行横向和纵向膨胀和腐蚀操作,获得横线图和纵线图;再次,将横线图和纵线图经过相加运算获得点图,再将点图浓缩为单个像素点;从次,对像素点按行遍历,判断这些顶点是否是目标单元格的顶点,全部遍历结束后得到各目标单元格顶点,即可组成矩形框...

【专利技术属性】
技术研发人员:肖斌张峥陈树藩胡健康张宇王鹏凯
申请(专利权)人:上海铁新地理信息有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1