System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于知识图谱的标准作业程序生成方法技术_技高网
当前位置: 首页 > 专利查询>之江实验室专利>正文

一种基于知识图谱的标准作业程序生成方法技术

技术编号:40513705 阅读:7 留言:0更新日期:2024-03-01 13:30
本发明专利技术涉及一种基于知识图谱的标准作业程序生成方法,包括以下步骤:对标准作业程序进行知识图谱的本体设计;对不同类型的标准作业程序文档进行知识抽取的模板标注;基于OCR技术,对标准作业程序文档中的信息进行自动知识抽取;将抽取出的知识与本体概念对齐;构建出每个概念下的实体表;构建用于描述实体间关系的关系表;基于实体表和关系表,进行实体对齐处理;通过Neo4j构建出用于用户查询的图数据库服务。与现有技术相比,本发明专利技术将纸质或电子文档形式的标准作业程序数字化,能够有效实现标准作业程序的内容知识化、应用智能化。

【技术实现步骤摘要】

本专利技术涉及标准数字化,尤其是涉及一种基于知识图谱的标准作业程序生成方法


技术介绍

1、标准作业程序(standard operating procedure,sop)是描述某一作业的流程、任务、操作等的规范化说明。标准作业程序在制造业中被广泛应用,具体包括作业指导书、生产工艺过程卡、检验指导书等。标准作业程序用于指导和规范日常工作,通过规定作业目的、作业步骤、作业要求等,使同一作业每次都被相同的方式执行,确保工作的一致性、合规性、标准化。标准作业程序通常包括标题、目的、适用范围、责任与角色、流程步骤、相关文件、附录等内容。

2、标准作业程序的关键特征和元素包括:

3、(1)清晰的步骤说明:提供执行任务或操作的步骤说明,包括步骤顺序、步骤描述;应包括执行步骤必要的其他内容,如安全注意事项、异常处理、关键时间点等;

4、(2)责任和角色分配:明确执行任务或操作的各个角色和责任,如各步骤的操作人员、审核者等,分工清晰、合理,确保工作的协调性和责任明确;

5、(3)所需资源清单:列出执行工作所需的所有材料、设备、工具等资源清单,明确设备型号、工具名称等资源的具体要求;

6、(4)变更情况说明:记录标准作业程序的定期审查和更新情况,确保该作业程序的有效性,并始终与最新的工作流程和标准保持一致。

7、标准作业程序通过上述内容及关键要素的规范化,以实现作业流程的标准化、作业程序关键控制点的细化与量化,进而指导和规范日常工作,降低错误的风险、提高效率和安全性。

8、标准作业程序应当采用合适的形式表达,目前在企业中大多以纸质或电子的文档形式为主,供作业人员翻看、查阅后参照使用,关键信息的定位、关联、更新、传递往往依靠从业多年人员的经验,电子文档中的文本、表格、图片所承载的信息无法被自动理解。然而,随着企业数字化进程的不断推进,传统形式的标准作业程序由于依赖人工阅读、内容无法信息化集成、变更迭代繁琐易出错,无疑会面临使用效率低、协同差、应用难等问题,导致无法响应未来工厂的数智化作业需求。


技术实现思路

1、本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于知识图谱的标准作业程序生成方法,能够将标准作业程序数字化,实现标准作业程序的内容知识化、应用智能化。

2、本专利技术的目的可以通过以下技术方案来实现:一种基于知识图谱的标准作业程序生成方法,包括以下步骤:

3、s1、对标准作业程序进行知识图谱的本体设计;

4、s2、对不同类型的标准作业程序文档进行知识抽取的模板标注;

5、s3、基于ocr(optical character recognition,光学字符识别)技术,对标准作业程序文档中的信息进行自动知识抽取;

6、s4、将抽取出的知识与本体概念对齐;

7、s5、构建出每个概念下的实体表;

8、s6、构建用于描述实体间关系的关系表;

9、s7、基于实体表和关系表,进行实体对齐处理;

10、s8、通过neo4j构建出用于用户查询的图数据库服务。

11、进一步地,所述步骤s1的具体过程为:

12、根据标准作业程序的内容,结合对应的标准,设计知识图谱本体,所述知识图谱本体定义了一组共享的基本概念和关系,用于描述相应领域内的实体、属性和关系。

13、进一步地,所述步骤s2具体包括以下步骤:

14、s21、上传标准作业程序文档作为待标注模板;

15、s22、通过单元格识别模型,对上传文档中存在的单元格进行识别;

16、s23、根据单元格识别结果,选择出键单元格;

17、s24、关联选择相应的值单元格及其信息类型;

18、s25、完成所有需要抽取的单元格标记;

19、s26、模板保存和复用。

20、进一步地,所述步骤s22的具体过程为:

21、s221、将文档图像转换为灰度图;

22、s222、使用大津法对灰度图进行二值化;

23、s223、使用霍夫变换检测图像中的横线和纵线;

24、s224、补全不完整的线段,对于每一条横线,计算与端点最近的纵线的交点,若交点不在横线上、且与端点的距离在设定阈值内,则用交点替换端点来补全线段;

25、s225、将检测的线段绘制成mask,对mask形态学提取轮廓得到单元格的坐标;

26、s226、剔除重叠的单元格。

27、进一步地,所述步骤s224中设定阈值具体为图像长宽之和的200分之一;

28、所述步骤s226具体是计算两两单元格之间的iou(intersection over union,交并比),若iou>0.5,则将两个单元格中面积大的单元格剔除掉。

29、进一步地,所述步骤s3具体包括以下步骤:

30、s31、从模板库中筛选出与待识别文档相匹配的模板;

31、s32、依次进行表格文本行检测及表格文本行识别;

32、s33、判断是否有表格,若有表格,则进行表格结构识别,之后进行标注框与文本框匹配;否则直接进行标注框与文本框匹配。

33、进一步地,所述步骤s33中进行标注框与文本框匹配的具体过程为:

34、根据模板匹配得到每个信息的标注框,其类型包括键、值、表格和图像,对于键和值,对整个文档图像识别文本得到文本框和文本值,之后根据坐标位置使用iou匹配标注框与文本框,当iou>0.5时认为标注框与文本框是匹配的,记录文本框对应的文本值;

35、对于表格,进行表格结构识别,再使用iou匹配表格单元格与文本框,将匹配的文本内容填到对应单元格的html标签中,记录其html表示;

36、对于图像,将图像区域保存成图片,记录其保存路径;

37、最终将键-值、键-表格、键-图像的结果以json格式输出。

38、进一步地,所述步骤s5的具体过程为:按照概念在关系型数据库中建立相应的表格,为每个概念创建一个数据表,该表格字段包括主键、实体名称和实体属性,实体属性包括对该实体的解释以及其他相关属性,每个属性会对应一个字段,数据表中每一行数据对应一个实体及其属性值。

39、进一步地,所述步骤s6具体是将实体表中的id关联起来,构成三元组:头实体、尾实体、关系名,并将三元组在关系型数据库中记录为关系表,关系表的字段包括头实体,尾实体,关系名,关系属性。

40、进一步地,所述步骤s7具体包括以下步骤:

41、s71、抽取实体名和实体属性嵌入得到特征向量1;

42、s72、抽取相邻实体和关系嵌入得到特征向量2;

43、s73、将特征向量1和2组成特征矩阵;

44、s74、计算两两实体嵌入向量的相似度;

<本文档来自技高网
...

【技术保护点】

1.一种基于知识图谱的标准作业程序生成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤S1的具体过程为:

3.根据权利要求2所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤S2具体包括以下步骤:

4.根据权利要求3所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤S22的具体过程为:

5.根据权利要求4所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤S224中设定阈值具体为图像长宽之和的200分之一;

6.根据权利要求4所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤S3具体包括以下步骤:

7.根据权利要求6所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤S33中进行标注框与文本框匹配的具体过程为:

8.根据权利要求7所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤S5的具体过程为:按照概念在关系型数据库中建立相应的表格,为每个概念创建一个数据表,该表格字段包括主键、实体名称和实体属性,实体属性包括对该实体的解释以及其他相关属性,每个属性会对应一个字段,数据表中每一行数据对应一个实体及其属性值。

9.根据权利要求8所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤S6具体是将实体表中的ID关联起来,构成三元组:头实体、尾实体、关系名,并将三元组在关系型数据库中记录为关系表,关系表的字段包括头实体,尾实体,关系名,关系属性。

10.根据权利要求9所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤S7具体包括以下步骤:

...

【技术特征摘要】

1.一种基于知识图谱的标准作业程序生成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤s1的具体过程为:

3.根据权利要求2所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤s2具体包括以下步骤:

4.根据权利要求3所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤s22的具体过程为:

5.根据权利要求4所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤s224中设定阈值具体为图像长宽之和的200分之一;

6.根据权利要求4所述的一种基于知识图谱的标准作业程序生成方法,其特征在于,所述步骤s3具体包括以下步骤:

7.根据权利要求6所述的一种基于知识图谱的标准作业程序生成方法,其特...

【专利技术属性】
技术研发人员:田品李炜铭杨婧马小雯段曼妮王佳玮刘彦林王永恒
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1