System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 科学健身知识图谱构建方法、系统、存储介质和电子设备技术方案_技高网

科学健身知识图谱构建方法、系统、存储介质和电子设备技术方案

技术编号:41180134 阅读:3 留言:0更新日期:2024-05-07 22:14
本发明专利技术涉及知识图谱构建技术领域,尤其涉及一种科学健身知识图谱构建方法、系统、存储介质和电子设备,该方法包括:从多个原始科学健身数据中,获取多个第一科学健身三元组数据;基于目标实体对齐算法,对所有的第一科学健身三元组数据进行实体对齐,得到多个目标科学健身三元组数据;根据所有的目标科学健身三元组数据,构建科学健身知识图谱。本发明专利技术能够提升科学健身知识图谱构建的数据质量与精准度,丰富了科学健身知识图谱内容信息,并减轻了人工干预的负担。

【技术实现步骤摘要】

所属的技术人员知道,本专利技术可以实现为方法、系统、存储介质和电子设备。因此,本专利技术可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本专利技术还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram),只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。尽管上面已经示出和描述了本专利技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本专利技术的限制,本领域的普通技术人员在本专利技术的范围内可以对上述实施例进行变化、修改、替换和变型。


技术介绍

1、随着我国经济的增长和公众观念的转变,人民群众对健身的需求愈加强烈。然而,科学健身知识图谱构建方面的技术方案相对匮乏,无法实现科学健身知识推广以及精准地为用户提供健身指导。

2、因此,亟需提供一种技术方案解决上述问题。


技术实现思路

1、为解决上述技术问题,本专利技术提供了一种科学健身知识图谱构建方法、系统、存储介质和电子设备

2、第一方面,本专利技术提供一种科学健身知识图谱构建方法,该方法的技术方案如下:

3、从多个原始科学健身数据中,获取多个第一科学健身三元组数据;

4、基于目标实体对齐算法,对所有的第一科学健身三元组数据进行实体对齐,得到多个目标科学健身三元组数据;

5、根据所有的目标科学健身三元组数据,构建科学健身知识图谱。

6、本专利技术的一种科学健身知识图谱构建方法的有益效果如下:

7、本专利技术的方法能够提升科学健身知识图谱构建的数据质量与精准度,丰富了科学健身知识图谱内容信息,并减轻了人工干预的负担。

8、在上述方案的基础上,本专利技术的一种科学健身知识图谱构建方法还可以做如下改进。

9、在一种可选的方式中,从多个原始科学健身数据中,获取多个第一科学健身三元组数据的步骤,包括:

10、对每个原始科学健身数据分别进行预处理,得到多个第一科学健身数据;

11、利用训练好的spert-gdpnet模型,从多个第一科学健身数据中,获取多个第一科学健身三元组数据。

12、在一种可选的方式中,所述spert-gdpnet模型包括:实体识别模块、gdpnet模块和关系分类模块;利用训练好的spert-gdpnet模型,从多个第一科学健身数据中,获取多个第一科学健身三元组数据的步骤,包括:

13、将所有的第一科学健身数据输入至所述实体识别模块中进行实体识别,得到多个科学健身命名实体、多个实体跨度表征和多个上下文信息表征;

14、将所有的第一科学健身数据输入至所述gdpnet模块中进行关系抽取,得到多个科学健身实体关系表征;

15、将所有的科学健身命名实体、所有的实体跨度表征、所有的上下文信息表征和所有的科学健身实体关系表征输入至所述关系分类模块进行关系分类,得到多个第一科学健身三元组数据。

16、在一种可选的方式中,所述目标实体对齐算法为训练好的dedupe算法;基于目标实体对齐算法,对所有的第一科学健身三元组数据进行实体对齐,得到多个目标科学健身三元组数据的步骤,包括:

17、对每个第一科学健身三元组数据进行数据预处理,得到多个第二科学健身三元组数据;

18、计算每两个第二科学健身三元组数据中的不同科学健身命名实体之间的实体特征相似度值;

19、基于所述训练好的dedupe算法,将实体特征相似度值大于或等于预设相似度值的两个科学健身三元组数据进行实体对齐,得到目标科学健身三元组数据,并将实体特征相似度值小于所述预设相似度值的两个科学健身三元组数据分别确定为目标科学健身三元组数据。

20、在一种可选的方式中,还包括:

21、对每个原始科学健身数据进行标注,得到多个科学健身标注数据,并基于所有的科学健身标注数据,对待训练的spert-gdpnet模型进行迭代训练,得到所述训练好的spert-gdpnet模型。

22、在一种可选的方式中,还包括:

23、利用已构建的目标展示平台,对所述科学健身知识图谱进行可视化展示。

24、第二方面,本专利技术提供一种科学健身知识图谱构建系统,该系统的技术方案如下:

25、包括:获取模块、处理模块和构建模块;

26、所述获取模块用于:从多个原始科学健身数据中,获取多个第一科学健身三元组数据;

27、所述处理模块用于:基于目标实体对齐算法,对所有的第一科学健身三元组数据进行实体对齐,得到多个目标科学健身三元组数据;

28、所述构建模块用于:根据所有的目标科学健身三元组数据,构建科学健身知识图谱。

29、本专利技术的一种科学健身知识图谱构建系统的有益效果如下:

30、本专利技术的系统能够提升科学健身知识图谱构建的数据质量与精准度,丰富了科学健身知识图谱内容信息,并减轻了人工干预的负担。

31、在上述方案的基础上,本专利技术的一种科学健身知识图谱构建系统还可以做如下改进。

32、在一种可选的方式中,所述获取模块具体用于:

33、对每个原始科学健身数据分别进行预处理,得到多个第一科学健身数据;

34、利用训练好的spert-gdpnet模型,从多个第一科学健身数据中,获取多个第一科学健身三元组数据。

35、第三方面,本专利技术提供的一种存储介质的技术方案如下:

36、存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如本专利技术的一种科学健身知识图谱构建方法的步骤。

37、第四方面,本专利技术的一种电子设备的技术方案如下:

38、包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,所述处理器执行所述程序时实现如本专利技术的一种科学健身知识图谱构建方法的步骤。

39、上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式本文档来自技高网...

【技术保护点】

1.一种科学健身知识图谱构建方法,其特征在于,包括:

2.根据权利要求1所述的科学健身知识图谱构建方法,其特征在于,从多个原始科学健身数据中,获取多个第一科学健身三元组数据的步骤,包括:

3.根据权利要求2所述的科学健身知识图谱构建方法,其特征在于,所述SpERT-GDPNet模型包括:实体识别模块、GDPNet模块和关系分类模块;利用训练好的SpERT-GDPNet模型,从多个第一科学健身数据中,获取多个第一科学健身三元组数据的步骤,包括:

4.根据权利要求1所述的科学健身知识图谱构建方法,其特征在于,所述目标实体对齐算法为训练好的Dedupe算法;基于目标实体对齐算法,对所有的第一科学健身三元组数据进行实体对齐,得到多个目标科学健身三元组数据的步骤,包括:

5.根据权利要求2或3所述的科学健身知识图谱构建方法,其特征在于,还包括:

6.根据权利要求1所述的科学健身知识图谱构建方法,其特征在于,还包括:

7.一种科学健身知识图谱构建系统,其特征在于,包括:获取模块、处理模块和构建模块;

8.根据权利要求7所述的科学健身知识图谱构建系统,其特征在于,所述获取模块具体用于:

9.一种存储介质,其特征在于,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如权利要求1至6中任一项所述的科学健身知识图谱构建方法。

10.一种电子设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的科学健身知识图谱构建方法的步骤。

...

【技术特征摘要】

1.一种科学健身知识图谱构建方法,其特征在于,包括:

2.根据权利要求1所述的科学健身知识图谱构建方法,其特征在于,从多个原始科学健身数据中,获取多个第一科学健身三元组数据的步骤,包括:

3.根据权利要求2所述的科学健身知识图谱构建方法,其特征在于,所述spert-gdpnet模型包括:实体识别模块、gdpnet模块和关系分类模块;利用训练好的spert-gdpnet模型,从多个第一科学健身数据中,获取多个第一科学健身三元组数据的步骤,包括:

4.根据权利要求1所述的科学健身知识图谱构建方法,其特征在于,所述目标实体对齐算法为训练好的dedupe算法;基于目标实体对齐算法,对所有的第一科学健身三元组数据进行实体对齐,得到多个目标科学健身三元组数据的步骤,包括:

...

【专利技术属性】
技术研发人员:潘冰玉杜姝潼刘芷彤
申请(专利权)人:北京体育大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1