The invention discloses an automatic identification and understanding method of process model diagram, which belongs to the field of process mining. First, the basic primitive template is constructed, and then the primitive template is used to match the process model diagram to identify the task, activity, event, gateway, arrow and other model elements in the process model diagram, and the filtering technology is used. Remove duplicate matching nodes and mismatched areas; then use process model graph cutting technology to get the picture of the area where the node contains text, and use OCR word recognition technology to identify the text in the picture; then process the process model graph to gray-scale processing, and obtain and store the gray-scale value matrix of the process model graph, the most. Then, according to the position of the arrow and the nearest neighbor node in the model graph, the beginning node and the end node of the directed edge are identified by traversing the gray value matrix. The invention can correctly identify the type of the model node, the position of the model node and the text in the model node, and also correctly identify the directed edge in the flow model diagram.
【技术实现步骤摘要】
一种流程模型图的自动识别与理解方法
本专利技术属于流程挖掘领域,具体涉及一种流程模型图的自动识别与理解方法。
技术介绍
当前流程模型图的识别与理解主要包含两类方案:一种是使用工程图识别系统来识别流程模型图,第二种是通过静态规则库完成流程模型图的识别。第一种方法使用工程图识别系统识别流程模型图,根据工程领域的不同,现有的工程识图系统有法国LORIA研究所的Celesstin系统、以色列工程技术大学的MDUS系统等等。在使用工程图识别系统识别流程模型图时,首先需要将流程模型图位图中转为工程识图系统可读取的矢量描述,然后在矢量描述基础上识别基本图元、识别模型元素符号和提取模型语义。第二种方法使用静态规则库完成流程模型的识别,首先定义流程模型图中模型节点和有向边的基本图元,然后通过图像相似度计算方法,在流程模型图中匹配基本图元,识别流程模型图中的模型元素。综合分析两种方法,工程识图系统能够识别图片中的基本图元,识别工程对象和工程语义,但是工程识图系统通用性差,工程识图系统根据工程领域定义了节点的类型,而流程模型图中节点类型工程图中节点类型不完全相同,因此使用工程识图系统识别流程模型图会存在模型节点丢失的问题。静态规则库定义了流程模型图中的基本图元,因此可以识别流程模型图中模型节点的类型和位置,但是流程模型图中有向边的形状不确定,不能定义所有形状边的基本图元,因此使用静态规则库识别流程模型图会丢失有向边的信息。本专利技术提出一种流程模型图的自动识别与理解技术,可以准确的识别模型节点的位置、尺寸和模型节点的文本,能够准确的识别有向边的开始结束节点。因此从整体来看本专利 ...
【技术保护点】
1.一种流程模型图的自动识别与理解方法,其特征在于:采用模型元素识别模块、模型节点文本识别模块和模型有向边识别模块;模型元素识别模块,被配置为构建基本图元模板,使用基本图元模板识别流程模型中包括活动、任务、事件、网关、箭头在内的模型元素,使用筛选技术去除重复匹配节点和错误匹配区域;模型节点文本识别模块,被配置为根据模型节点的位置和尺寸切割流程模型图,获得模型节点所在区域的小图片,使用OCR文字识别技术识别小图片中的文本;模型有向边识别模块,被配置为灰度处理流程模型图,获得并存储流程模型图中每个像素点的灰度值,生成流程模型图灰度值矩阵,并根据箭头位置、箭头最近邻节点位置,从灰度值矩阵中遍历识别有向边;所述的将流程模型图自动识别与理解的方法,具体包括如下步骤:步骤1:模型元素的识别;步骤2:模型节点文本的识别;步骤3:模型有向边的识别。
【技术特征摘要】
1.一种流程模型图的自动识别与理解方法,其特征在于:采用模型元素识别模块、模型节点文本识别模块和模型有向边识别模块;模型元素识别模块,被配置为构建基本图元模板,使用基本图元模板识别流程模型中包括活动、任务、事件、网关、箭头在内的模型元素,使用筛选技术去除重复匹配节点和错误匹配区域;模型节点文本识别模块,被配置为根据模型节点的位置和尺寸切割流程模型图,获得模型节点所在区域的小图片,使用OCR文字识别技术识别小图片中的文本;模型有向边识别模块,被配置为灰度处理流程模型图,获得并存储流程模型图中每个像素点的灰度值,生成流程模型图灰度值矩阵,并根据箭头位置、箭头最近邻节点位置,从灰度值矩阵中遍历识别有向边;所述的将流程模型图自动识别与理解的方法,具体包括如下步骤:步骤1:模型元素的识别;步骤2:模型节点文本的识别;步骤3:模型有向边的识别。2.根据权利要求1所述的流程模型图的自动识别与理解方法,其特征在于:在步骤1中,具体包括如下步骤:步骤1.1:基本图元模板的构造;通过研究流程模型图的基本组成单元,构造包括事件、活动、网关、任务、箭头在内的模型元素的图元模板,其中每个图元模板都有对应的图元图片、元素类型、元素宽度和元素高度;步骤1.2:模型元素的匹配;将图元模板在流程模型图中滑动,并通过图像相似度计算方法计算图元模板与流程模型图中各个重叠区域的相似度,从所有区域中...
【专利技术属性】
技术研发人员:段华,原桂远,曾庆田,刘聪,李超,鲁法明,倪维健,周长红,赵华,林泽东,刁秀丽,温彦,
申请(专利权)人:山东科技大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。