【技术实现步骤摘要】
面向知识图谱的离散型制造行业工艺数据提取方法及系统
[0001]本专利技术涉及工艺实体识别
,尤其涉及一种面向知识图谱的离散型制造行业工艺数据提取方法及系统
。
技术介绍
[0002]知识抽取是构建大规模知识图谱的重要环节,知识的抽取过程为知识图谱提供了最基础的数据
。
因为离散制造企业工艺数据的复杂性,目前在该类型企业中,普遍存在工艺数据多源异构的问题
。
工艺多源异构数据通常以不同的表达形式,以结构化或非结构化的方式存储在不同工艺数据系统中
。
有效的提取工艺数据有利于保证产品质量
、
提高生产效率以及促使产品升级改进等,在得到有效利用的前提下能够为工艺设计过程提供依据,同时对制造过程的持续改进提供支持,进而提高制造企业的竞争力
。
[0003]目前知识图谱已经具有结构化组织工艺数据的能力,并且通过图谱内已有的工艺数据能够实现工艺的推理,但在工艺数据提取方面仍然存在部分不足
。
[0004]另外,现有技术在工艺数据的表达及应用方面存在诸多问题:离散型制造企业的工艺数据通常来自多个不同的数据源,可能涵盖了结构化数据和非结构化数据;从不同数据源提取的数据可能存在质量不一致
、
不准确或缺失的情况,从而影响知识图谱的准确性和可靠性;工艺数据中可能包含丰富的领域专业知识和术语,需要进行深入的语义理解才能准确地构建知识图谱;将多源数据映射到统一的知识表示模型,并进行有效的知识融合效果并不理想;构建知 ...
【技术保护点】
【技术特征摘要】
1.
一种面向知识图谱的离散型制造行业工艺数据提取方法,其特征在于,包括以下步骤:根据工艺信息构建工艺本体模型,根据工艺本体模型构建知识图谱模式层;利用知识图谱模式层对结构化工艺数据进行提取;将非结构化工艺数据进行预处理,并将预处理后的数据按照数据类型分为固定部分信息和浮动部分信息,其中,浮动部分信息包括非工艺描述性语句和工艺描述性语句;构建工艺表格,在工艺表格中对固定部分信息和浮动部分信息进行定义,利用工艺表格对固定部分信息和浮动部分信息中的非工艺描述性语句进行提取;利用命名实体识别模型对工艺描述性语句进行提取
。2.
如权利要求1所述的面向知识图谱的离散型制造行业工艺数据提取方法,其特征在于,所述工艺信息包括产品信息
、
工艺过程信息
、
工艺资源信息和工厂信息
。3.
如权利要求1所述的面向知识图谱的离散型制造行业工艺数据提取方法,其特征在于,所述工艺本体模型由实体类型
、
属性
、
属性类型和关系构成
。4.
如权利要求1所述的面向知识图谱的离散型制造行业工艺数据提取方法,其特征在于,利用知识图谱模式层对结构化工艺数据进行提取的具体步骤为:根据知识图谱模式层分析结构化工艺数据结构,捕获结构化工艺数据的含义和关系;根据结构化工艺数据的含义和关系进行数据抽取;对抽取的数据进行数据映射和数据同步更新
。5.
如权利要求4所述的面向知识图谱的离散型制造行业工艺数据提取方法,其特征在于,从分析关系型数据库中进行数据抽取包括实体抽取
、
关系抽取和属性抽取
。6.
如权利要求1所述的面向知识图谱的离散型制造行业工艺数据提取方法,其特征在于,将非结构化工艺数据进行预处理的具体步骤为:确定待提取的非结构化工艺数据,判定非结构化工艺数据的文件类型及处理方式,并将非结构化工艺数据转化为系统兼容的格式
。7.
如权利要求1所述的面向知识图谱的离散型制造行业工...
【专利技术属性】
技术研发人员:靳化振,魏松,马春娜,邱慧慧,李建勋,屈亚宁,刘斌,李龙传,邵梦,张金龙,
申请(专利权)人:山东山大华天软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。