一种构建制造领域术语库的方法及系统技术方案

技术编号:24996055 阅读:27 留言:0更新日期:2020-07-24 17:58
本发明专利技术涉及一种构建制造领域术语库的方法,包括如下的步骤:S000:初始化制造领域术语库;S100:抽取术语并计算术语的信息细化度;S200:对术语排序;S300:计算当前领域术语和术语库中领域术语的相似度;S400:根据信息细化度和相似度,选择当前领域术语的可能的关联术语;S500:在语料库中验证关系模式的置信度,如果可信,将当前领域术语加入术语库;否则,删除当前领域术语;S600:循环步骤S300~步骤S500,直到领域文档中所有术语均已经加入术语库或被删除。本发明专利技术还包括一种构建制造领域术语库的系统。本发明专利技术可以有效解决制造业领域内概念相同却定义有差异的问题,方便制造企业内部以及企业间知识管理和信息交换。

【技术实现步骤摘要】
一种构建制造领域术语库的方法及系统
本专利技术涉及互联网技术在制造领域中的应用,尤其是在智能制造术语库建模领域的应用,具体的是一种构建制造领域术语库的方法及系统。
技术介绍
由于制造领域知识数据涉及多组织、多流程、多产品,具有多源、互联等特点,引发了制造知识数据处理的诸多问题。并且制造业的加工流程每个细分领域都会有自己术语与习惯的表达用法,难以统一理解和交流。此情况同样出现在制造领域。目前本领域迫切需要一种技术,能够促进制造企业知识的重用和共享,方便制造企业内部以及企业间知识管理和信息交换,促进制造业以中间产品为导向的、满足企业主流程的集成制造管理平台的商品化。基于此,特提出本专利技术。
技术实现思路
为了解决现有技术中存在的上述问题,本专利技术提供一种构建制造领域术语库的方法,能够实现制造企业知识的重用和共享,方便制造企业内部以及企业间知识管理和信息交换。本专利技术的技术方案为:一种构建制造领域术语库的方法,包括如下的步骤:S000:初始化制造领域术语库;S100:从制造领域语料库的本文档来自技高网...

【技术保护点】
1.一种构建制造领域术语库的方法,其特征在于,包括如下的步骤:/nS000:初始化制造领域术语库;/nS100:从制造领域语料库的领域文档中抽取领域术语,并计算所述领域术语的信息细化度;/nS200:将步骤S100获得的所有领域术语按照其信息细化度进行排序,得到术语队列;/nS300:从所述排序后的术语队列中获取当前领域术语,并计算当前领域术语和所述制造领域术语库中领域术语的相似度;/nS400:根据信息细化度和相似度,获取当前领域术语的关联术语;/nS500:在制造领域语料库中验证当前领域术语与关联术语之间的关联关系的置信度,如果置信度低于一预定阈值,则判定为可信,并将当前领域术语加入所述制...

【技术特征摘要】
1.一种构建制造领域术语库的方法,其特征在于,包括如下的步骤:
S000:初始化制造领域术语库;
S100:从制造领域语料库的领域文档中抽取领域术语,并计算所述领域术语的信息细化度;
S200:将步骤S100获得的所有领域术语按照其信息细化度进行排序,得到术语队列;
S300:从所述排序后的术语队列中获取当前领域术语,并计算当前领域术语和所述制造领域术语库中领域术语的相似度;
S400:根据信息细化度和相似度,获取当前领域术语的关联术语;
S500:在制造领域语料库中验证当前领域术语与关联术语之间的关联关系的置信度,如果置信度低于一预定阈值,则判定为可信,并将当前领域术语加入所述制造领域术语库;否则,删除当前领域术语;
S600:循环步骤S300~步骤S500,直到所述领域文档中所有术语均已被加入制造领域术语库或被删除。


2.如权利要求1所述的构建制造领域术语库的方法,其特征在于,所述信息细化度的表述采用如下方式:其中,c为领域术语,grade(c)为领域术语c的信息细化度,l为领域术语c的长度,S为与领域术语c有重合部分的所有种子领域术语中的信息细化度的最高值。


3.如权利要求1所述的构建制造领域术语库的方法,其特征在于,所述信息细化度的表述采用如下方式:其中,c为领域术语,grade(c)为领域术语c的信息细化度,n为领域术语库中与领域术语c有重合部分的种子领域术语数量,这些种子领域术语分别为t1、t2...tn,它们的信息细化度分别为grade(t1)、grade(t2)...grade(tn),它们的信息细化度的算术平均数为Sm。


4.如权利要求1所述的构建制造领域术语库的方法,其特征在于,所述信息细化度的表述采用如下方式:其中,c为领域术语,grade(c)为领域术语c的信息细化度,n为领域术语库中与领域术语c有重合部分的种子领域术语数量,这些种子领域术语分别为t1、t2...tn,它们的信息细化度分别为grade(t1)、grade(t2)...grade(tn),P(tk|c)表示与c有重合部分的种子领域术语tk...

【专利技术属性】
技术研发人员:赵亮刘佳李坡高振兴奉菲
申请(专利权)人:北京中科院软件中心有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1