一种评审意见智能校核方法技术

技术编号:36529634 阅读:6 留言:0更新日期:2023-02-01 16:11
本发明专利技术公开了一种评审意见智能校核方法包括,建立多级标题层次序号顺序标识的数据字典;建立文档结构中固化的一级标题和二级标题的数据字典;建立各类工程子项对应二级标题下三级标题的数据字典;建立电网、设备参数的数据字典;建立地区简称、科学单位、数字、工程子项名称、半角字符等正则化提取模型公式;利用多级标题层次序号顺序标识数据字典识别并标识各自然段落标题等级或者标识为正文。利用数据字典和正则化提取公式标记各级标题,判断各级标题是否正确;利用正则化提取公式,从正文和附件中提取数据,判断正文和附件中工程名称、子项名称和数量、科学单位表示、字符使用是否正确,判断工程子项中工程量是否正确;利用正则化提取公式,判断正文部分和概算附表中工程量是否一致。实现对评审意见中标题层次序号、标题内容、科学单位内容和表述方式、字符、数值的多角度校核,缩短评审意见校核周期,提高评审意见出具的效率和质量。高评审意见出具的效率和质量。高评审意见出具的效率和质量。

【技术实现步骤摘要】
一种评审意见智能校核方法


[0001]本专利技术涉及文档智能校核
,特别是,涉及一种评审意见智能校核方法。

技术介绍

[0002]初步设计评审意见,是电网基建工程重要技术文件,是开展设备招标、施工建设的重要依据。为确保评审意见格式合规,内容准确,需要耗费各专业大量的人力进行校核,是评审意见出具过程中耗时较多的环节。如何借助计算机高效、准确的特点,提高评审意见出具效率,一直是重点关注和研究的内容。当前许多计算机语言都带有字符处理功能,python语言中的re(regular expression正则表达式)库提供了一些字段匹配、提取功能,通过构建正则化表达式,可以按照预定的设想,解析目标字符串,解析结果与提前建立或动态生成的数据字典进行比较,判断文档中序号、科学单位、标点符号、数值内容是否符合要求,能有效克服人工校核的各种弊端,极大地提高评审意见的质量。因此开发一种评审意见智能校核方法,具有十分重要的意义。

技术实现思路

[0003]本专利技术提供了一种评审意见智能校核方法,实现对评审意见中标题层次序号、标题内容、科学单位内容和表述方式、字符、数值的多角度校核,缩短评审意见校核周期,提高评审意见出具的效率和质量。
[0004]为实现上述目的,本专利技术采取了以下技术方案。
[0005]为解决上述技术问题,本专利技术提供如下技术方案:一种评审意见智能校核方法,其包括,
[0006]建立正文多级标题层次序号顺序标识的数据字典;
[0007]在数据库中按规则建立最多6级结构层次的顺序字典,并将汉字顺序与阿拉伯数字顺序一一对应,第1级至第6级结构层次序号顺序按{一、~二十、}{(一)~(二十)}{1.~20.}{(1)~(20)}{1)~20)}{1、~20、}的设定,每一级结构的序号顺序在数据库中按1

20升序标识。
[0008]作为本专利技术所述评审意见智能校核方法的一种优选方案,其中:所述建立固化的一级标题和二级标题的数据字典,根据评审意见模板,正文的一级标题名称固定不变,二级标题有部分是名称不变的,存在某一级标题下的所有二级标题顺序相对固定,记录可以根据需要删减的情况,在数据库中建立起所有一级标题的数据字典和针对某一级标题下所有二级标题的数据字典,并按升序标识先后顺序。
[0009]作为本专利技术所述评审意见智能校核方法的一种优选方案,其中:所述建立各类工程子项对应二级标题下三级标题的数据字典包括,
[0010]所述工程子项的二级标题名称不固定,工程子项类型可分为变电站新建工程、变电站改造工程、变电站扩建工程、架空线路工程、电缆线路工程在数据库中提前建立各类子项中的按顺序标记的三级标题数据字典;对于名称固定,但根据需要可删减的系统及电气
二次部分、通信部分,同样在数据库中提前建立这两个二级标题下按顺序标记的三级标题数据字典。
[0011]作为本专利技术所述评审意见智能校核方法的一种优选方案,其中:
[0012]建立电压序列集合[10kV,35kV,66kV,110kV,220kV,330kV,500kV,750kV,1000kV]。
[0013]建立变电站主接线型式序列结合[线变组,内桥,单母线,单母线分段,单母线带旁路,双母线,双母线单分段,双母线双分段,一个半断路器]。
[0014]建立经常使用的变压器容量序列集合[10MVA,20MVA,31.5MVA,40MVA,50MVA]。
[0015]建立设备额定电流序列集合[1250A,2000A,3150A,40000A,50000A]。
[0016]建立设备开断电流序列集合[31.5kA,40kA,50kA,63kA]。
[0017]作为本专利技术所述评审意见智能校核方法的一种优选方案,其中:所述建立地区简称、科学单位、数字、工程子项名称、半角字符等正则化提取模型公式为校核评审意见提供解决途径;
[0018]利用Python语言构建相应的正则化表达式。
[0019]作为本专利技术所述评审意见智能校核方法的一种优选方案,其中:所述利用多级标题层次序号顺序标识数据字典识别并标识各自然段落标题等级或者标识为正文,利用数据字典分别生成一至六级标题序号特征识别的正则化表达式;
[0020]所述根据建立的一至六级标题序号正则化表达式,利用findall()函数,对每一自然段进行匹配,如果函数返回值为空,标识该段不是标题,是正文,如果返回值不为空,对应确定该段落为莫一级标题,函数值判断结果分三种,分别是错误函数、标题函数、正文函数。其判断流程流程为,
[0021]当函数返回值数值为0时,判断为错误函数,将此函数返回值数据删除处理;
[0022]当函数返回值为空时,判断为正文函数,将此函数返回值数值放入正文数据中;
[0023]当函数返回值为1

6任一整数时,判断为标题函数,将此函数返回值数值放入对应的标题函数中;
[0024]当函数返回值为超过6的数值时,判断为错误函数,将此函数返回值数据删除处理。
[0025]作为本专利技术所述评审意见智能校核方法的一种优选方案,其中:所述利用数据字典和正则化提取公式标记各级标题,判断各级标题是否正确;利用权利6中各级标题序号的正则化表达式,提取到各级标题序号的返回值,与数据字典中的顺序号相比较,如果不是按升序顺序,在校核结果中注明标题序号有误。
[0026]作为本专利技术所述评审意见智能校核方法的一种优选方案,其中:所述利用正则化表达式,从正文和附件中提取数据,判断正文和附件中工程名称、子项名称和数量、科学单位表示、字符使用是否正确,判断工程子项中工程量是否正确。
[0027]作为本专利技术所述评审意见智能校核方法的一种优选方案,其中:所述利用权利要求5中提取子项名称的正则化表达式,在确定列举子项名称的段落,执行findall()函数,取得子项名称集合列表,与选定范围内的所有二级标题名称相比较,两个集合内容相同,证明工程子项名称前后对应,集合内容存在差异,将差异部分标注为校核存在问题。
[0028]作为本专利技术所述评审意见智能校核方法的一种优选方案,其中:所述数字正则化
表达式,对分别对工程子项和概算附表中的段落执行findall()函数,分别对比返回值是否相同,数据不相同,可校核为有数据错误。
[0029]本专利技术有益效果为:作为本专利技术所述利用数字正则化表达式,对分别对工程子项和概算附表中的段落执行findall()函数,分别对比返回值是否相同,数据不相同,可校核为有数据错误。实现对评审意见中标题层次序号、标题内容、科学单位内容和表述方式、字符、数值的多角度校核,缩短评审意见校核周期,提高评审意见出具的效率和质量。
附图说明
[0030]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种评审意见智能校核方法,其特征在于:建立正文多级标题层次序号顺序标识的数据字典;在数据库中按规则建立最多6级结构层次的顺序字典,并将汉字顺序与阿拉伯数字顺序一一对应,第1级至第6级结构层次序号顺序按{一、~二十、}{(一)~(二十)}{1.~20.}{(1)~(20)}{1)~20)}{1、~20、}的设定,每一级结构的序号顺序在数据库中按1

20升序标识。2.如权利要求1所述的一种评审意见智能校核方法,其特征在于:所述建立固化的一级标题和二级标题的数据字典,根据评审意见模板,正文的一级标题名称固定不变,二级标题有部分是名称不变的,存在某一级标题下的所有二级标题顺序相对固定,记录可以根据需要删减的情况,在数据库中建立起所有一级标题的数据字典和针对某一级标题下所有二级标题的数据字典,并按升序标识先后顺序。3.如权利要求1或2所述的一种评审意见智能校核方法,其特征在于:所述建立各类工程子项对应二级标题下三级标题的数据字典包括,所述工程子项的二级标题名称不固定,工程子项类型可分为变电站新建工程、变电站改造工程、变电站扩建工程、架空线路工程、电缆线路工程在数据库中提前建立各类子项中的按顺序标记的三级标题数据字典;对于名称固定,但根据需要可删减的系统及电气二次部分、通信部分,同样在数据库中提前建立这两个二级标题下按顺序标记的三级标题数据字典。4.如权利要求3所述的一种评审意见智能校核方法,其特征在于:所述设置参数流程为:建立电压序列集合[10kV,35kV,66kV,110kV,220kV,330kV,500kV,750kV,1000kV];建立变电站主接线型式序列结合[10kV,35kV,66kV,110kV,220kV,330kV,500kV,750kV,1000kV];建立经常使用的变压器容量序列集合[10MVA,20MVA,31.5MVA,40MVA,50MVA];建立设备额定电流序列集合[1250A,2000A,3150A,40000A,50000A];建立设备开断电流序列集合[31.5kA,40kA,50kA,63kA];所述建立变电站主接线型式序列结合[线变组,内桥,单母线,单母线分段,单母线带旁路,双母线,双母线单分段,双母线双分段,一个半断路器。5.如权利要求4所述的一种评审意见智能校核方法,其...

【专利技术属性】
技术研发人员:陈国龙李博王铭锋王勇刘岩吕忠华吴卓航胡瑞雪李冬雪刘然王长春李宁金子开高勋赵芯莹毕月昊昊张吉贾博杨国琛
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1