当前位置: 首页 > 专利查询>天津大学专利>正文

一种构建小规模半结构化数据知识图谱的方法及系统技术方案

技术编号:44829794 阅读:33 留言:0更新日期:2025-03-28 20:22
本发明专利技术涉及人工智能大数据技术领域,具体涉及一种构建小规模半结构化数据知识图谱的方法及系统,通过获取待构建知识图谱的小规模半结构化数据,确定实体对象和属性参数,根据对数据的预处理和文本相似度计算,得到数据文本的相似度,然后构建对应的正则表达式,运用正则表达式进行实体和关系的抽取,进而得到抽取结果,根据最终的抽取输出结果,进行小规模半结构化数据的图谱构建。本发明专利技术通过正则表达式进行实体和关系的抽取,尤其对数值型属性的抽取,相较于现有直接使用模型抽取构建知识图谱来说,弥补了知识图谱在小样本半结构化数据领域的缺陷,增强了对数值型特征值的抽取的能力,从而提高构建小规模半结构化数据图谱的有效性和准确性。

【技术实现步骤摘要】

本专利技术涉及人工智能大数据,具体涉及一种构建小规模半结构化数据知识图谱的方法及系统


技术介绍

1、随着互联网的发展,海量数据的产生和积累已成为常态,这些数据中包含了丰富的信息和知识,但往往以非结构化或半结构化的形式存在,难以直接用于分析和决策,如何有效地组织、管理和利用这些数据,成为一个重要的研究课题。知识图谱是一种用于表示和存储结构化数据的技术,它可以将数据中的实体、属性和关系抽象为图中的节点和边,从而形成一个具有语义信息的数据网络。知识图谱可以支持多种应用场景,如搜索引擎、智能问答、推荐系统等。然而现有的知识图谱的构建都是基于大规模数据样本实现的,目前对于小规模数据的图谱构建缺乏有效的方法。此外,现有的知识抽取方法主要针对文本信息,对于数值型特征的抽取能力有限,导致在小样本半结构化数据领域存在缺陷,这些问题限制了知识图谱在特定领域的应用,尤其是在数据量有限或数据结构复杂的情况下。综上,目前亟需一种构建小规模半结构化数据知识图谱的方法,用于提高构建小规模半结构化数据知识图谱的有效性和准确性。


技术实现思

<本文档来自技高网...

【技术保护点】

1.一种构建小规模半结构化数据知识图谱的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种构建小规模半结构化数据知识图谱的方法,其特征在于,所述步骤S1中,首先获取待构建知识图谱的源数据,其中源数据可以为多种形式,源数据文本中包括半结构化数据和非结构化数据;若源数据中包括非结构化数据,则可通过对源数据进行处理,得到待构建知识图谱的半结构化数据。

3.根据权利要求1所述的一种构建小规模半结构化数据知识图谱的方法,其特征在于,所述步骤S2中,对数据文本进行预处理采用以下方法:

4.根据权利要求1所述的一种构建小规模半结构化数据知识图谱的方法,其...

【技术特征摘要】

1.一种构建小规模半结构化数据知识图谱的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种构建小规模半结构化数据知识图谱的方法,其特征在于,所述步骤s1中,首先获取待构建知识图谱的源数据,其中源数据可以为多种形式,源数据文本中包括半结构化数据和非结构化数据;若源数据中包括非结构化数据,则可通过对源数据进行处理,得到待构建知识图谱的半结构化数据。

3.根据权利要求1所述的一种构建小规模半结构化数据知识图谱的方法,其特征在于,所述步骤s2中,对数据文本进行预处理采用以下方法:

4.根据权利要求1所述的一种构建小规模半结构化数据知识图谱...

【专利技术属性】
技术研发人员:冉云龙郭磊李东阳赵纪为王现勋王浩
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1