【技术实现步骤摘要】
一种电力施工文档校验方法、装置、电子设备及存储介质
[0001]本专利技术实施例涉及计算机
,尤其涉及一种电力施工文档校验方法、装置、电子设备及存储介质。
技术介绍
[0002]目前,每个电力施工项目在电力施工过程中,都会产生大量的电力施工文档,其中包括各种文档类型不同的电力施工文档。每个文档类型对应的电力施工文档都会有不同的文档格式以及不同的文档内容。为了便于对电力施工项目进行项目管理以及项目审核,需要对电力施工文档进行校验。
[0003]然而,现有的电力施工文档校验方法通常是由人工进行校验,但是人工信息核查速度较慢,而且容易出错导致准确率较低。
技术实现思路
[0004]本专利技术实施例提供一种电力施工文档校验方法、装置、电子设备及存储介质,能够自动对电力施工文档进行校验,提高电力施工文档的校验速度以及校验准确率。
[0005]根据本专利技术的一方面,提供了一种电力施工文档校验方法,包括:
[0006]获取待校验电力施工项目文档,并确定所述待校验电力施工项目文档中的至少一个第 ...
【技术保护点】
【技术特征摘要】
1.一种电力施工文档校验方法,其特征在于,包括:获取待校验电力施工项目文档,并确定所述待校验电力施工项目文档中的至少一个第一待校验文档,以及至少一个第二待校验文档;其中,所述第二待校验文档为所述第一待校验文档中具有设定逻辑关系的文档;将各所述第一待校验文档依次输入至预先训练完成的文档分类模型,以通过所述文档分类模型确定各所述第一待校验文档的文档类型;根据各所述第一待校验文档的文档类型,对各所述第一待校验文档进行完整规范校验;在各所述第一待校验文档的完整规范校验结果满足完整规范校验条件的情况下,对各所述第二待校验文档进行文档逻辑校验。2.根据权利要求1所述的方法,其特征在于,在所述获取待校验电力施工项目文档之前,还包括:获取第一历史电力施工文档,并对所述第一历史电力施工文档进行单字符识别,得到可识别文档;确定所述可识别文档的文档类型标签;获取所述可识别文档中的文档标题;获取所述文档标题对应的文档内容,并对所述文档内容进行语义识别,以确定所述文档内容的内容类型;根据所述文档类型标签、所述文档标题以及所述文档内容的内容类型,构建标准文档。3.根据权利要求2所述的方法,其特征在于,在所述将各所述第一待校验文档依次输入至预先训练完成的文档分类模型之前,还包括:获取设定数量的第二历史电力施工文档,并将各所述第二历史电力施工文档依次输入至所述文档分类模型中;通过所述文档分类模型,对各所述第二历史电力施工文档进行数据抽取,得到待训练文档数据;通过所述文档分类模型,对所述待训练文档数据进行预处理,将所述待训练数据中的空数据和异常数据去除,得到待训练可用数据;通过所述文档分类模型,对所述待训练可用数据进行特征提取以及数值化处理,得到待训练可用向量;通过所述文档分类模型,确定所述待训练可用向量,与标准特征向量之间的文本相似度;其中,所述标准特征向量是根据所述标准文档确定的特征向量;根据所述文本相似度对所述文档分类模型的模型参数进行调整。4.根据权利要求2所述的方法,其特征在于,所述通过所述文档分类模型确定各所述第一待校验文档的文档类型,包括:通过所述文档分类模型,确定各所述第一待校验文档的第一文档数据;通过所述文档分类模型,对各所述第一文档数据进行预处理,将所述第一文档数据中的空数据和异常数据去除,得到第一文档可用数据;通过所述文档分类模型,对所述第一文档可用数据进行特征提取以及数值化处理,得到文档特征向量;
通过所述文档分类模型,确定各所述文档特征向量与标准特征向量之间的文本相似度;其中,所述标准特征向量是根据所述标准文档确定的特征向量;通过所述文档分类模型,根据所述文本相似度确定各所述第一待校验文档的文档类型。5.根据权利要求4所述的方法,其特征在于,所述根据所述文本相似度确定各...
【专利技术属性】
技术研发人员:胡金磊,周亚,张名捷,赵耀鹏,
申请(专利权)人:广东电网有限责任公司清远供电局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。