【技术实现步骤摘要】
标准知识图谱构建、标准查询方法及装置
本专利技术涉及计算机
,尤其涉及一种标准知识图谱构建、标准查询方法及装置。
技术介绍
标准是对重复性事物和概念所做的统一规定,它以科学、技术和实践经验的综合为基础,作为共同遵守的准则和依据。标准的制定和类型按内容划分有基础标准(一般包括名词术语、符号、代号、机械制图、公差与配合等)、产品标准、辅助产品标准(工具、模具、量具、夹具等)、原材料标准、方法标准(包括工艺要求、过程、要素、工艺说明等)。在对标准进行查询或宣贯学习时,目前多采用在标准文档(如PDF文档)中输入关键字,定位到文档中关键字所处的位置,然后人工阅读文档上下文提取相关数据信息,但该方法在每次需要进行标准查询或宣贯时,均需人工重复阅读提取相关数据信息,效率较低。
技术实现思路
本专利技术提供一种标准知识图谱构建、标准查询方法及装置,用以解决现有技术中提取标准中的数据信息效率低下的缺陷。本专利技术提供一种标准知识图谱构建方法,包括:获取样本标准文本数据;基于结构化模板, ...
【技术保护点】
1.一种标准知识图谱构建方法,其特征在于,包括:/n获取样本标准文本数据;/n基于结构化模板,对所述样本标准文本数据中的标准要素进行数据抽取,得到第一抽取数据;/n基于所述样本标准文本数据携带的非标要素标签,对所述样本标准文本数据中的非标要素进行数据抽取,得到第二抽取数据;/n分别对所述第一抽取数据和所述第二抽取数据进行实体链接,构建标准知识图谱。/n
【技术特征摘要】
1.一种标准知识图谱构建方法,其特征在于,包括:
获取样本标准文本数据;
基于结构化模板,对所述样本标准文本数据中的标准要素进行数据抽取,得到第一抽取数据;
基于所述样本标准文本数据携带的非标要素标签,对所述样本标准文本数据中的非标要素进行数据抽取,得到第二抽取数据;
分别对所述第一抽取数据和所述第二抽取数据进行实体链接,构建标准知识图谱。
2.根据权利要求1所述的标准知识图谱构建方法,其特征在于,所述结构化模板包括标准文本中各标准要素的位置信息;
所述基于结构化模板,对所述样本标准文本数据中的标准要素进行数据抽取,得到第一抽取数据,包括:
基于所述标准文本中各标准要素的位置信息,对所述样本标准文本数据中的标准要素进行数据抽取,得到所述第一抽取数据。
3.根据权利要求1所述的标准知识图谱构建方法,其特征在于,所述分别对所述第一抽取数据和所述第二抽取数据进行实体链接,包括:
基于所述第一抽取数据的标准要素标签,对所述第一抽取数据进行实体链接,所述标准要素标签是基于所述第一抽取数据在所述样本标准文本数据中的位置,以及所述结构化模板确定的;
基于所述第二抽取数据的非标要素标签,对所述第二抽取数据进行实体链接。
4.根据权利要求2所述的标准知识图谱构建方法,其特征在于,所述标准要素包括标准名称、标准章节、标准起草单位、标准指标以及标准术语中的至少一种。
5.根据权利要求1至4任一项所述的标准知识图谱构建方法,其特征在于,在分别对所述第一抽取数据和所述第二抽取数据进行实体链接之后,还包括:
基于SQL脚本,将所述实体链接导入至所述标准知识图谱的数据库。
6.一种标准知...
【专利技术属性】
技术研发人员:郝文建,王立玺,胡晨,高艳炫,
申请(专利权)人:中国电子技术标准化研究院,北京赛西科技发展有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。