一种知识图谱的构建方法和装置制造方法及图纸

技术编号:39967139 阅读:25 留言:0更新日期:2024-01-09 00:30
本发明专利技术公开了一种知识图谱的构建方法和装置,涉及知识图谱技术领域。该方法的一具体实施方式包括:从物品描述文本中识别出每个预设类型对应的待处理文本;识别出所述待处理文本中的各个标题文本和各个普通文本;确定各个标题文本之间的层级关系以及所述标题文本与所述普通文本之间的文本关系;根据所述层级关系和所述文本关系,确定所述标题文本和所述普通文本中的实体及实体关系,以根据所述实体和所述实体关系构建与所述物品描述文本对应的知识图谱。该实施方式能够提高实体识别、实体关系抽取的准确率,进而提高构建的知识图谱的准确率,减少了人工干预的程度。

【技术实现步骤摘要】

本专利技术涉及知识图谱,尤其涉及一种知识图谱的构建方法和装置


技术介绍

1、知识图谱是将不同种类的信息连接在一起而得到的一个关系网络。以知识的广度来看,知识图谱主要分为全领域知识图谱和垂直领域知识图谱。

2、现有技术中,针对专业文本(如药品说明书等规范文本)生成的垂直领域知识图谱时,没有利用专业文本的文本结构特点,如忽略了文本中的大标题、小标题等文本结构中的实体和实体关系的获取,并且对文本中距离较远的实体之间的实体关系不能准确抽取,从而使得构建的知识图谱的准确率较低,导致人工干预的程度较高。


技术实现思路

1、有鉴于此,本专利技术实施例提供一种知识图谱的构建方法和装置,能够提高实体识别、实体关系抽取的准确率,进而提高构建的知识图谱的准确率,减少了人工干预的程度。

2、为实现上述目的,根据本专利技术实施例的一个方面,提供了一种知识图谱的构建方法,包括:

3、从物品描述文本中识别出每个预设类型对应的待处理文本;

4、识别出所述待处理文本中的各个标题文本和各个普通文本文档来自技高网...

【技术保护点】

1.一种知识图谱的构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,从物品描述文本中识别出每个预设类型对应的待处理文本,包括:

3.根据权利要求1所述的方法,其特征在于,识别出所述待处理文本中的各个标题文本和各个普通文本,包括:

4.根据权利要求1所述的方法,其特征在于,识别出所述待处理文本中的各个标题文本和各个普通文本,包括:

5.根据权利要求1所述的方法,其特征在于,确定各个标题文本之间的层级关系以及所述标题文本与所述普通文本之间的文本关系,包括:

6.根据权利要求5所述的方法,其特征在于,确定所述标题...

【技术特征摘要】

1.一种知识图谱的构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,从物品描述文本中识别出每个预设类型对应的待处理文本,包括:

3.根据权利要求1所述的方法,其特征在于,识别出所述待处理文本中的各个标题文本和各个普通文本,包括:

4.根据权利要求1所述的方法,其特征在于,识别出所述待处理文本中的各个标题文本和各个普通文本,包括:

5.根据权利要求1所述的方法,其特征在于,确定各个标题文本之间的层级关系以及所述标题文...

【专利技术属性】
技术研发人员:杨帅张亚周谦吴元清
申请(专利权)人:北京京东拓先科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1