一种基于AI的工程施工档案文件电子化方法及装置制造方法及图纸

技术编号:37442107 阅读:11 留言:0更新日期:2023-05-06 09:14
本发明专利技术提供一种基于AI的工程施工档案文件电子化方法及装置,属于数据处理技术领域,具体包括:获取待进行电子化的纸质档案的题目、页数、提交单位,并当不存在与纸质档案的题目一致的电子档案时,获取纸质档案的签字笔迹,并采用基于AI算法的笔迹识别模型,基于签字笔迹确定所述签字人员的身份,并当签字人员的身份具有权限时,基于签字笔迹,采用基于PSO

【技术实现步骤摘要】
一种基于AI的工程施工档案文件电子化方法及装置


[0001]本专利技术属于数据处理
,尤其涉及一种基于AI的工程施工档案文件电子化方法及装置。

技术介绍

[0002]为了实现对工程施工档案的电子化处理,在授权专利技术专利CN112329669B《一种电子档案管理方法》中通过将对待识别文档图像进行切割,得到包含文字的子图,将包含文字的子图与标准文字进行匹配,得到候选文本,将候选文本进行关键词识别,得到关键词,根据关键词得到待识别文档图像的分类,并在待识别文档图像上标记分类信息,从而可以有效的进行分类存储及管理,识别及存储效率高、准确率高,但是却存在以下技术问题:
[0003]1、忽视了对档案的签字的真伪识别,在工程施工档案中,不同阶段的工程验收档案,均需要施工单位、监理等单位的负责人的签字确认,但是却存在有些签字均是通过代签或者后期签字等方式进行伪造,若不进行档案的签字的真伪识别,则档案的可靠性和真实性都不能得到保证。
[0004]2、忽视了对档案的重复性识别,由于施工档案的数量较多,在实际的进行电子化处理过程中,往往会存在重复归档的行为,不仅会导致存储空间的浪费,而且使得档案的存储管理变得异常混乱。
[0005]针对上述技术问题,本专利技术提供了一种基于AI的工程施工档案文件电子化方法及装置。

技术实现思路

[0006]为实现本专利技术目的,本专利技术采用如下技术方案:
[0007]根据本专利技术的一个方面,提供了一种基于AI的工程施工档案文件电子化方法。
>[0008]一种基于AI的工程施工档案文件电子化方法,其特征在于,具体包括:
[0009]S11获取待进行电子化的纸质档案的题目、页数、提交单位,并基于所述纸质档案的提交单位确定待筛选的电子档案;
[0010]S12基于所述待筛选的电子档案,判断是否存在于所述纸质档案的题目一致的电子档案,若是,则进入步骤S13,若否,则直接继续进入步骤S14;
[0011]S13获取所述纸质档案的页数,并判断是否与所述纸质档案的题目一致的电子档案的页数一致,若是,则输出纸质档案已被电子化处理,进行进一步的确认,若否,则进入步骤S14;
[0012]S14获取所述纸质档案的签字笔迹,并采用基于AI算法的笔迹识别模型,基于所述签字笔迹确定所述签字人员的身份,并判断所述签字人员的身份是否具有权限,若是,则进入步骤S15,若否,则输出签字人员不存在权限,档案无法进行电子化处理;
[0013]S15基于所述签字笔迹,采用基于PSO

CNN

SVM模型实现对所述签字笔迹的真伪确认,并根据所述真伪确认的结果确定是否将所述纸质档案进行电子化处理。
[0014]通过分步骤采用提交单位、纸质档案的题目、页数对纸质档案的重复的判断,不仅较为准确,综合结合多方面的因素实现对重复的判断,而且通过从粗到细,使得总体的重复的判断的效率也得到一定程度的提升。
[0015]通过基于签字笔迹首先实现对签字人员的身份的确认,并在此基础上对权限进行确认,从而首先通过对身份的判断首先实现筛选,从而减少了进行签字笔迹的真伪确认的数量,在保证较好的准确性的基础上,进一步提升了整体的判断效率。
[0016]通过采用基于PSO

CNN

SVM模型实现对所述签字笔迹的真伪确认,从而结合了CNN算法在提取图像特征的优势以及SVM算法在进行分类判别的效率,并为了进一步提升整体的效率,采用PSO算法对CNN算法的隐含层数量进行寻优,进一步提升了整体的处理效率。
[0017]进一步的技术方案在于,采用基于OCR文字识别的方式实现对进行电子化的纸质档案的题目和提交单位的确认。
[0018]进一步的技术方案在于,当所述纸质档案的题目一致的电子档案的页数与所述纸质档案的页数一致时,还需要对所述纸质档案的题目一致的电子档案的段数进行确认,当且仅当所述纸质档案的题目一致的电子档案的段数与所述纸质档案的段数一致时,则输出纸质档案已被电子化处理,进行进一步的确认。
[0019]进一步的技术方案在于,确认所述签字人员的身份的具体步骤为:
[0020]S21获取所述纸质档案的签字笔迹图像,并将所述签字笔迹图像进行初始化处理,得到处理后的签字笔迹图像;
[0021]S22将所述处理后的签字笔迹图像进行图像归一化处理,将所述处理后的签字笔迹图像转换为标准尺寸的标准签名笔迹图像;
[0022]S23基于所述标准签名笔迹图像,进行特征提取得到笔迹图像特征,采用基于WOA

LSSVM算法的笔迹识别模型,得到签名识别结果;
[0023]S24基于所述签名识别结果确定所述签字档案的签字人员的身份。
[0024]通过对签字笔迹进行处理并进行归一化处理,从而避免了由于图像的不一致或者质量较低或者倾斜角度存在问题导致的识别的准确性和效率都较低的问题的出现,通过采用WOA

LSSVN算法的预测模型,从而进一步提升了判断的效率。
[0025]进一步的技术方案在于,所述初始化处理包括对所述签字笔迹图像进行灰度化处理、图像去噪处理。
[0026]进一步的技术方案在于,所述笔迹图像特征包括形状特征、几何特征和纹理特征。
[0027]进一步的技术方案在于,实现对签字笔迹的真伪确认的具体步骤为:
[0028]S31基于PSO

CNN算法的特征提取模型,对所述标准签名笔迹图像进行特征提取得到笔迹特征,所述笔迹特征包括所述标准签名笔迹图像的beta笔画特征;
[0029]S32将所述标准签名笔迹图像的beta笔画特征传输至基于SVM算法的笔迹模型中,得到分类预测结果;
[0030]S33基于所述分类预测结果实现对签字笔迹的真伪确认.
[0031]通过采用基于PSO

CNN

SVM模型实现对所述签字笔迹的真伪确认,从而结合了CNN算法在提取图像特征的优势以及SVM算法在进行分类判别的效率,并为了进一步提升整体的效率,采用PSO算法对CNN算法的隐含层数量进行寻优,进一步提升了整体的处理效率。
[0032]进一步的技术方案在于,基于所述标准签名笔迹图像的beta笔画特征与现有的笔
迹签名数据库中的beta历史笔画特征进行比对得到相似度评价结果,并基于所述相似度评价结果实现对所述签字笔迹的真伪确认。
[0033]进一步的技术方案在于,基于所述相似度评价结果、所述签字人员的身份所对应的签字笔迹被认定存在问题的次数得到修正相似度评价结果,对所述签字笔迹的真伪进行确认,其中所述修正相似度评价结果的计算公式为:
[0034][0035]其中P1为相似度评价结果,取值范围在0到1之间,K1为常数,取值在0到0.2之间,t为所述签字人员的身份所对应的签字笔迹被认定存在问题的次数,t1为次数阈值,至少为4次。
本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于AI的工程施工档案文件电子化方法,其特征在于,具体包括:S11获取待进行电子化的纸质档案的题目、页数、提交单位,并基于所述纸质档案的提交单位确定待筛选的电子档案;S12基于所述待筛选的电子档案,判断是否存在于所述纸质档案的题目一致的电子档案,若是,则进入步骤S13,若否,则直接继续进入步骤S14;S13获取所述纸质档案的页数,并判断是否与所述纸质档案的题目一致的电子档案的页数一致,若是,则输出纸质档案已被电子化处理,进行进一步的确认,若否,则进入步骤S14;S14获取所述纸质档案的签字笔迹,并采用基于AI算法的笔迹识别模型,基于所述签字笔迹确定所述签字人员的身份,并判断所述签字人员的身份是否具有权限,若是,则进入步骤S15,若否,则输出签字人员不存在权限,档案无法进行电子化处理;S15基于所述签字笔迹,采用基于PSO

CNN

SVM模型实现对所述签字笔迹的真伪确认,并根据所述真伪确认的结果确定是否将所述纸质档案进行电子化处理。2.如权利要求1所述的工程施工档案文件电子化方法,其特征在于,采用基于OCR文字识别的方式实现对进行电子化的纸质档案的题目和提交单位的确认。3.如权利要求1所述的工程施工档案文件电子化方法,其特征在于,当所述纸质档案的题目一致的电子档案的页数与所述纸质档案的页数一致时,还需要对所述纸质档案的题目一致的电子档案的段数进行确认,当且仅当所述纸质档案的题目一致的电子档案的段数与所述纸质档案的段数一致时,则输出纸质档案已被电子化处理,进行进一步的确认。4.如权利要求1所述的工程施工档案文件电子化方法,其特征在于,确认所述签字人员的身份的具体步骤为:S21获取所述纸质档案的签字笔迹图像,并将所述签字笔迹图像进行初始化处理,得到处理后的签字笔迹图像;S22将所述处理后的签字笔迹图像进行图像归一化处理,将所述处理后的签字笔迹图像转换为标准尺寸的标准签名笔迹图像;S23基于所述标准签名笔迹图像,进行特征提...

【专利技术属性】
技术研发人员:宋田庆刘昌盛刘鹏伟刘磊
申请(专利权)人:国网河南省电力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1