A method of process image recognition is proposed in this paper. Its technical features are: first, a flowchart structure model (CBSM) based on the corner point is set up, and the various corner types, combination rules and constraints used to describe the structure elements of the flowchart are defined in form, and then the flow chart structure is extracted and the flow chart is detected. The corner points of the structure and the peripheral features of the corner point neighborhood are extracted. The SVM classifier is used to classify the corner points, and the flow chart structure is identified based on the CBSM. Finally, the results of the process image recognition are output in text form. The invention based on the corner feature recognition flowchart structure element, can solve the problem that the existing process image recognition technology can not deal with the problem of text drawing adhesion and edge breaking, and provides a new method for process image recognition.
【技术实现步骤摘要】
一种流程图像识别方法
本专利技术属于图像识别
,特别涉及一种流程图像识别方法。
技术介绍
现有计算机信息检索系统主要采用基于文本匹配的检索技术,但化工、制药、机械、信息技术等领域中的文档往往还包含大量流程图像,这些图像蕴含丰富的信息,对于检索和查新至关重要。流程图可以直观地描述一个工作过程的具体步骤,具有重要的语义。由于现存文档中的流程图存在文图粘连和断边等情况导致流程图像识别效率不高,因此需要一种能够新的流程图像识别方法,解决以上问题。
技术实现思路
本专利技术的目的在于提供一种流程图像识别方法,通过基于角点特征的结构模型来识别流程图像。本方法包括建立一个基于角点的流程图结构模型(CBSM),然后对流程图结构进行角点检测与角点分类,依据角点组合规则和组合约束来识别流程图结构元素。为了实现上述目的,本专利技术采用的技术方案是:一种流程图像识别方法能够基于角点特征描述和识别流程图结构,步骤包括:S1建立CBSM,定义角点类型、描述流程图结构元素的角点组合规则以及角点组合约束包括:S11将描述流程图结构元素的角点分为独立型和连接型两大类,命名各类角点并建立流程图像角点分类表;S12建立角点组合规则;S13建立角点组合约束。S2提取流程图像结构;对原始流程图像进行二值化、降噪处理,通过图文分割提取原始流程图像中的结构图层,对提取的流程图结构进行单像素化。S3对流程图结构进行角点检测和筛选,步骤为:S31通过CSS算法利用曲率检测出与直线型元素相关的角点,过滤掉曲线型结构元素上的圆角点和虚假角点。不同尺度σ下的曲率计算公式为:其中t是弧长参数,σ是尺度参数,分别 ...
【技术保护点】
1.一种流程图像识别方法,其特征在于,包括如下步骤:S1建立一个基于角点的流程图结构模型(CBSM),定义描述流程图结构元素的角点类型、角点组合规则以及角点组合约束;S2提取流程图结构;S3对流程图结构进行角点检测和筛选;S4得到步骤S3中角点的邻域特征并训练角点分类器,对角点进行分类;S5基于CBSM对流程图结构元素进行识别;S6文本识别以及结构描述生成。
【技术特征摘要】
1.一种流程图像识别方法,其特征在于,包括如下步骤:S1建立一个基于角点的流程图结构模型(CBSM),定义描述流程图结构元素的角点类型、角点组合规则以及角点组合约束;S2提取流程图结构;S3对流程图结构进行角点检测和筛选;S4得到步骤S3中角点的邻域特征并训练角点分类器,对角点进行分类;S5基于CBSM对流程图结构元素进行识别;S6文本识别以及结构描述生成。2.根据权利要求1所述流程图像识别方法,其特征在于,所述步骤S1中建立CBSM,定义描述流程图结构元素的角点类型、角点组合规则以及角点组合约束包括:S11将描述流程图结构元素的角点分为独立型和连接型两大类,命名各角点类型并建立流程图像角点分类表;S12建立角点组合规则;S13建立角点组合约束。3.根据权利要求2所述流程图像识别方法,其特征在于,所述步骤S11中,经典图元包括矩形、菱形和椭圆形,定义矩形为R图元,菱形为D图元,椭圆形为E图元,则描述经典图元的角点及其命名规则如下:将仅属于单个图元或连接线的角点定义为独立型角点,其中对R图元的四个角点和折线的角点,分别命名为:┌:R-1、┐:R-2、└:R-3、┘:R-4;将位于图元与连接线或连接线与连接线相接处的角点定义为连接型角点,其中对R图元和连接线相接处以及连接线与连接线相接处的角点,分别命名为:┴:Rb-1、┬:Rb-2、┤:Rb-3、├:Rb-4;将E图元的独立型角点根据位置分别命名为:El-1、Er-1、El-2、Er-2;将组成E图元的连接型角点分别命名为:┴:Rb-1、┬:Rb-2;将D图元的独立型角点按照上下左右的顺序依次命名为D-1、D-2、D-3、D-4;将D图元的连接型角点按照上下左右的顺序依次命名为Db-1、Db-2、Db-3、Db-4;所述步骤S12中,根据图元几何关系和角点相对位置关系,定义组合规则如下:角点相对位置关系:以Ci,Cj(i≠j)表示两个不同角点,x(Ci)表示角点Ci横坐标,y(Ci)表示角点Ci纵坐标,角点Cj相对于角点Ci的位置关系有8种,分别为左上、左、左下、下、右下、右、右上、上,依次分别表示为ul、l、dl、d、dr、r、ur、u,每种位置关系对应一个判定表达式;以r(Ci,Cj)表示Cj在Ci的右方位置,满足x(Ci)<x(Cj);d(Ci,Cj)表示Cj在Ci下方位置,满足y(Ci)<y(Cj);dl(Ci,Cj)表示Cj在Ci的左下方位置,满足(x(Ci)>x(Cj))∧(y(Ci)<y(Cj));其中,r(Ci,Cj)等价于l(Cj,Ci),d(Ci,Cj)等价于u(Cj,Ci),dr(Ci,Cj)等价于ul(Cj,Ci),dl(Ci,Cj)等价于ur(Cj,Ci),d(Ci,Cj)等价于u(Cj,Ci),r(Ci,Cj)等价于l(Cj,Ci);在流程图结构元素中,角点间几何关系描述为水平关系H或者垂直关系V,H(Ci,Cj)表示Ci与Cj处于同一条水平线上,满足y(Ci)=y(Cj);V(Ci,Cj)表示Ci与Cj处于同一条垂直线上,满足x(Ci)=y(Cj);其中,H(Ci,Cj)等价于H(Cj,Ci),V(Ci,Cj)等价于V(Cj,Ci);R图元的角点组合为R-1∧R-2∧R-3∧R-4;R图元的角点相对位置关系表示如下:r(R-1,R-2)∧d(R-1,R-3)∧dr(R-1,R-4)∧dl(R-2,R-3)∧d(R-2,R-4)∧r(R-3,R-4);R图元的角点间几何关系表示如下:H(R-1,R-2)∧V(R-1,R-3)∧H(R-3,R-4)∧V(R-2,R-4);E图元的角点组合表示为El-1∧El-2∧Er-1∧Er-2;E图元的角点之间相对位置表示如下:r(El-1,Er-1)∧d(El-1,El-2)∧dr(El-1,Er-2)∧dl(Er-1,El-2)∧d(Er-1,Er-2)∧r(El-2,Er-2);E图元的角点间几何关系表示如下:H(El-1,Er-1)∧V(El-1,El-2)∧H(El-2,Er-2)∧V(Er-1,Er-2);D图元的角点组合表示为D*-1∧D*-2∧D*-3∧D*-4,D*-表示D-型角点或Db-型角点,D-型角点为独立型角点,Db-型角点为连接型角点;D图元的角点相对位置关系表示如下:d(D*-1,D*-2)∧dl(D*-1,D*-3)∧dr(D*-1,D*-4)∧ul(D*-2,D*-3)∧ur(D*-2,D*-4)∧r(D*-3,D*-4);D图元的角点间几何关系表示如下:H(D*-3,D*-...
【专利技术属性】
技术研发人员:孙连山,侯涛,张沙沙,
申请(专利权)人:陕西科技大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。