【技术实现步骤摘要】
标准知识图谱构建、标准查询方法及装置
本专利技术涉及计算机
,尤其涉及一种标准知识图谱构建、标准查询方法及装置。
技术介绍
随着信息技术的发展,数字经济时代的来临,传统行业领域的数字化转型需求已经迫在眉睫,尤其当前标准数字化进程快速发展,标准文本已经基本实现以pdf、word等数字格式为载体的机器可显示标准形式。然而,这种标准文本只能满足基本的翻阅、查询功能,例如在对标准进行查询时,多通过在标准电子文档(如PDF文档)中输入关键字,定位到文档中关键字所处的位置,然后人工阅读文档上下文提取相关数据信息,但该方法在每次需要进行标准查询时,均需人工重复阅读提取相关数据信息,效率较低。
技术实现思路
本专利技术提供一种标准知识图谱构建、标准查询方法及装置,用以解决现有技术中查询标准中的数据信息效率较低的缺陷。本专利技术提供一种标准知识图谱构建方法,包括:确定标准文本的类别;基于所述标准文本的类别,在标准编写规则中查询,确定所述标准文本的编写要素,并基于所述编写要素确定标准知识图谱中的 ...
【技术保护点】
1.一种标准知识图谱构建方法,其特征在于,包括:/n确定标准文本的类别;/n基于所述标准文本的类别,在标准编写规则中查询,确定所述标准文本的编写要素,并基于所述编写要素确定标准知识图谱中的头实体类型、尾实体类型以及头实体与尾实体之间的实体关系;/n基于所述头实体类型、所述尾实体类型以及所述实体关系,从所述标准文本中提取所述头实体类型对应的头实体,以及所述尾实体类型对应的尾实体;/n基于所述头实体以及所述尾实体,对所述标准知识图谱进行实体填充。/n
【技术特征摘要】
1.一种标准知识图谱构建方法,其特征在于,包括:
确定标准文本的类别;
基于所述标准文本的类别,在标准编写规则中查询,确定所述标准文本的编写要素,并基于所述编写要素确定标准知识图谱中的头实体类型、尾实体类型以及头实体与尾实体之间的实体关系;
基于所述头实体类型、所述尾实体类型以及所述实体关系,从所述标准文本中提取所述头实体类型对应的头实体,以及所述尾实体类型对应的尾实体;
基于所述头实体以及所述尾实体,对所述标准知识图谱进行实体填充。
2.根据权利要求1所述的标准知识图谱构建方法,其特征在于,所述编写要素包括结构化要素以及非结构化要素。
3.根据权利要求2所述的标准知识图谱构建方法,其特征在于,所述基于所述编写要素确定标准知识图谱中的头实体类型、尾实体类型以及头实体与尾实体之间的实体关系,包括:
若所述编写要素为结构化要素,则将预设关系关键词作为所述实体关系,并基于所述实体关系确定所述头实体类型以及所述尾实体类型;
若所述编写要素为非结构化要素,则将非结构化要素对应的标准文本输入至阅读理解模型中,得到所述阅读理解模型输出的所述实体关系,并基于所述实体关系确定所述头实体类型以及所述尾实体类型;其中,所述阅读理解模型是基于样本标准文本以及所述样本标准文本的实体关系训练得到的。
4.根据权利要求1至3任一项所述的标准知识图谱构建方法,其特征在于,所述基于所述头实体类型、所述尾实体类型以及所述实体关系,从所述标准文本中提取所述头实体类型对应的头实体,以及所述尾实体类型对应的尾实体,包括:
基于所述头实体类型、所述尾实体类型以及所述实体关系,确定实体提取规则,并基于所述实体提取规则,从所述标准文本中提取所述头实体类型对应的头实体,以及所述尾实体类型对应的尾实体。
5.根据权利要求1至3任一项所述的标准知识图谱构建方法,其特征在于,所述确定标准文本的类别,包括:
确定所述标准文本的标题中是否存在预设标题关键字,若是,则基于预设标题关键字与标准文本类别之间的映射关系,确定所述标准文本的类别;
若否,则基于所述标准文...
【专利技术属性】
技术研发人员:郝文建,张明英,张浩,高艳炫,胡晨,王立玺,
申请(专利权)人:中国电子技术标准化研究院,北京赛西科技发展有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。