一种基于规则电气图纸箱号的自动化查找方法技术

技术编号:15724872 阅读:208 留言:0更新日期:2017-06-29 11:24
本发明专利技术公开了一种基本规则的电气图纸箱号自动化查找方法,该方法包括:根据正则表达式和文本内容、数目、位置获取箱号候选文本集C、箱号可能文本集P;根据C和P的数量、内容、位置文本确定当前配电箱的箱号;根据图中各箱号的相似关系对可能找错箱号的配电箱进行重新查找箱号;对图内文本全局搜索,对当前的部分箱号进行补充。该方法通过多级优先权及依据箱号文本的关系进行修正及附加的方式,经过实践表明,具有很好的容错性、较高的准确率以及优良的可控性,可以显著提高成套电气报价员查找箱号的效率。

【技术实现步骤摘要】
一种基于规则电气图纸箱号的自动化查找方法
本专利技术涉及计算机软件领域,尤其涉及的是一种基于规则电气图纸箱号的自动化查找方法。
技术介绍
在电气行业,成套电气报价员需要根据从用户拿到的CAD电气设计图给出成套电气设备的报价。成套电气报价员需要根据这一CAD图与用户进行多次沟通交流。报价员需要首先从CAD图中找出每个需要报价的配电箱的箱号,给出该配电箱的价格,最后汇总给出所有配电箱的报价列表。作为一个很繁琐但又需要有一定领域知识的环节,箱号的查找到目前为止,只能通过报价员自己从CAD图中找出来,或者通过一些扒图软件(如利驰扒图软件)手动抠出箱号文本。这种传统的箱号查找方式的缺点主要有:●很大程度上依赖于报价员的背景知识,需要报价员根据知识判断找出箱号文本●如果一个工程有成百上千个的配电箱需要报价,那么箱号的查找过程也得重复那么多次●由于报价员的疏忽,漏找了部分箱号,导致工程报价出现比较大的偏差,导致后期需要多次检验校对●即使通过扒图软件给出了箱号的文本,如“AL2同AL1”,但由于没有格式化的输出这些箱号,扒图软件会得到“AL1AL2同AL1”作为箱号,而这个只能通过报价员自己后期对扒图软件给出的文本进行再次编辑,得到“AL1AL2”,过程繁琐●不能自动化实现智能查找因此,这种传统的只能通过人力去查找箱号的方式在一定程度上影响了报价员报价的速度与准确度,不能满足用户及公司的对快速精准报价方面要求,也影响了工程的进度。针对成套电气报价领域箱号查找的方式,目前领域内尚未有行之有效的自动化解决方案。因此,现有技术存在缺陷,需要改进。
技术实现思路
本专利技术所要解决的技术问题是:提供一种通过计算机软件自动查找,提高工程报价的速度与精度的基本规则的电气图纸箱号自动化查找方法。本专利技术的技术方案如下:一种基于规则电气图纸箱号的自动化查找方法,包括S1:根据正则表达式和文本内容、数目、位置获取箱号候选文本集C、箱号可能文本集P;S2:根据箱号候选文本集C和箱号可能文本集P的数量、内容、位置文本确定当前配电箱的箱号;S3:根据图中各箱号的相似关系对可能找错箱号的配电箱进行重新查找箱号;S4:对图内文本全局搜索,对当前的部分箱号进行补充。应用于上述技术方案中,所述的自动化查找方法中,步骤S1中,对于箱号候选文本集C,先通过正则表达式过滤出可能是箱号的文本集合,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本;对于箱号可能文本集P,先是通过正则表达式删除掉不可能是箱号的文本,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本。应用于各个上述技术方案中,所述的自动化查找方法中,赋予箱号候选文本集C相对箱号可能文本集P更高的优先权。应用于各个上述技术方案中,所述的自动化查找方法中,步骤S2中具体包括以下步骤:其中,用|C|表示箱号候选文本集C的文本数目,|P|表示箱号可能文本集P的文本数目;S21:当|C|=0,|P|=0;则最左上文本为箱号文本;S22:当|C|=0,|P|=1;箱号可能文本集P中的文本为箱号文本;S23:当|C|=0,|P|>1;如果最左上文本在箱号可能文本集P中,则最左上文本为箱号文本;如果最左下文本在箱号可能文本集P中,则最左下文本为箱号文本;否则,箱号可能文本集P中最左上的非中文文本为箱号文本;S24:当|C|=1;箱号候选文本集C中的文本为箱号文本;S25:当|C|>1;如果最左上文本在箱号候选文本集C中,则最左上文本为箱号文本;如果最左下文本在箱号候选文本集C中,则最左下文本为箱号文本;否则,箱号候选文本集C中最左上的非中文文本为箱号文本。应用于各个上述技术方案中,所述的自动化查找方法中,步骤S2中,在得到具体的箱号文本后,需要对箱号文本进行处理,并附加与该箱号相似的文本同时构成箱号,再进行箱号后处理,以得到正确的并格式化的输出。应用于各个上述技术方案中,所述的自动化查找方法中,步骤S3中,具体是根据同一张图中的配电箱的箱号之间的相似关系找出当前可能找错箱号的配电箱。应用于各个上述技术方案中,所述的自动化查找方法中,步骤S4中,在图内全局范围内搜索,找出图中带有“…同…”的文本,对于每个这样的文本,查找当前图中配电箱的箱号中,是否与该文本有关联,如果有关联,则将该文本也附加到与该文本关联的配电箱的箱号中,最后格式化输出。采用上述方案,本专利技术通过正则表达式及文本数目、内容、位置信息确定箱号的箱号候选文本集C(简称C)、箱号可行文本集P(简称P),并通过C和P的数量、内容、位置关系确定该配电箱最可能的箱号,最后利用图内各配电箱的箱号之间的关系对找错的箱号重新查找箱号。C内的文本为真实箱号文本的概率大于P内的文本为真实箱号文本的概率,在查找箱号的过程中对C和P查找顺序给了不同的优先级,以这种多级优先级查找方式比单纯只找出可能是箱号的文本进行查找的具有更好的容错性、更高的准确率以及更好的可控性。同时在后期中根据前面找出的箱号文本的内容、箱号之间的相似关系等对前面可能找错箱号的配电箱进行再次箱号查找,再次提高箱号查找的准确率。最后,通过图内文本全局搜索的方式,减少箱号找漏的情况的发生。附图说明图1为本专利技术的流程图。具体实施方式以下结合附图和具体实施例,对本专利技术进行详细说明。本实施例提供了一种基于规则电气图纸箱号的自动化查找方法,配电箱箱号自动化查找方法的流程如图1所示,包括以下步骤:S1:根据正则表达式和文本内容、数目、位置获取箱号候选文本集C、箱号可能文本集P,其中,箱号候选文本集C简称为C,箱号可能文本集P简称为P。箱号候选文本集C比箱号可能文本集P的定义更严格。对于箱号候选文本集C,首先,通过正则表达式过滤出可能是箱号的文本集合,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本;而对于箱号可能文本集P,先是通过正则表达式删除掉不可能是箱号的文本,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本。由于C的定义比P更严格,C的文本是真实箱号的可能性比P的文本要大些,因此在方法中给C中的文本赋予了更高的优先权。C内的文本为真实箱号文本的概率大于P内的文本为真实箱号文本的概率,在查找箱号的过程中对C和P查找顺序给了不同的优先级,以这种多级优先级查找方式比单纯只找出可能是箱号的文本进行查找的具有更好的容错性、更高的准确率以及更好的可控性。S2:根据C和P的数量、内容、位置文本确定当前配电箱的箱号。在这一步骤中,根据C和P的数量情况分开进行处理,为方便描述,用|C|示C的文本数目,|P|表示P的文本数目。表1:在得到具体的箱号文本后,需要对箱号文本进行处理,并附加与该箱号相似的文本同时构成箱号,再进行箱号后处理,以得到正确的并格式化的输出。S3:根据图中各箱号的相似关系对可能找错箱号的配电箱进行重新查找箱号。在同一张图中,不同配电箱的箱号在格式上很可能是相似的,在前面进行箱号查找的时候,方法是对每个配电箱都独立地进行查找箱号,因此可以根据同一张图中的配电箱的箱号之间的相似关系找出当前可能找错箱号的配电箱,对这些配电箱的箱号进行重新查找。同时由于中文一般不会是真实的箱号,因此如果当前给出的箱号为中文时,需要对该配电箱进行重新箱号查找。S4:对图内文本全局搜索,对当本文档来自技高网...
一种基于规则电气图纸箱号的自动化查找方法

【技术保护点】
一种基于规则电气图纸箱号的自动化查找方法,包括,其特征在于:S1:根据正则表达式和文本内容、数目、位置获取箱号候选文本集C、箱号可能文本集P;S2:根据箱号候选文本集C和箱号可能文本集P的数量、内容、位置文本确定当前配电箱的箱号;S3:根据图中各箱号的相似关系对可能找错箱号的配电箱进行重新查找箱号;S4:对图内文本全局搜索,对当前的部分箱号进行补充。

【技术特征摘要】
1.一种基于规则电气图纸箱号的自动化查找方法,包括,其特征在于:S1:根据正则表达式和文本内容、数目、位置获取箱号候选文本集C、箱号可能文本集P;S2:根据箱号候选文本集C和箱号可能文本集P的数量、内容、位置文本确定当前配电箱的箱号;S3:根据图中各箱号的相似关系对可能找错箱号的配电箱进行重新查找箱号;S4:对图内文本全局搜索,对当前的部分箱号进行补充。2.根据权利要求1所述的自动化查找方法,其特征在于:步骤S1中,对于箱号候选文本集C,先通过正则表达式过滤出可能是箱号的文本集合,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本;对于箱号可能文本集P,先是通过正则表达式删除掉不可能是箱号的文本,再删除掉全是中文的文本及在一个配电箱的范围内重复出现的文本。3.根据权利要求2所述的自动化查找方法,其特征在于:赋予箱号候选文本集C相对箱号可能文本集P更高的优先权。4.根据权利要求1所述的自动化查找方法,其特征在于:步骤S2中具体包括以下步骤:其中,用|C|表示箱号候选文本集C的文本数目,|P|表示箱号可能文本集P的文本数目;S21:当|C|=0,|P|=0;则最左上文本为箱号文本;S22:当|C|=0,|P|=1;箱号可能文本集P中的文本为箱号文本;...

【专利技术属性】
技术研发人员:詹建洲吴贺杨李本栋孙尔安
申请(专利权)人:广州算易软件科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1