当前位置: 首页 > 专利查询>湖北大学专利>正文

面向维基百科的概念先决条件关系挖掘方法及相关设备技术

技术编号:39414568 阅读:8 留言:0更新日期:2023-11-19 16:05
本发明专利技术提供一种面向维基百科的概念先决条件关系挖掘方法及相关设备

【技术实现步骤摘要】
面向维基百科的概念先决条件关系挖掘方法及相关设备


[0001]本专利技术涉及数据处理
,更具体地,涉及一种面向维基百科的概念先决条件关系挖掘方法

一种面向维基百科的概念先决条件关系挖掘装置

一种电子设备以及一种存储介质


技术介绍

[0002]随着信息技术的飞速发展,网络学习作为一种新常态的学习方式得到了长足发展

利用互联网进行在线学习已成为年轻一代获取知识的重要途径,然而相比于传统的面授方式,网络课堂所存在的一个最大问题是如何保证学习者能够充分理解网络课程所学知识

那些出现在电子文档或者课程视频中的各种知识概念,如果可以搞清楚之间的语义关系,将帮助学习者更好进行理解和学习

例如当谈到“人工智能”话题时,不可避免会介绍“机器学习”和“深度学习”等相关概念

对于一个刚刚入门人工智能的学生而言可能还不完全清楚“机器学习”与“深度学习”之间的关系,但是如果通过某种方式让其知道概念“深度学习”与“机器学习”的相关学习顺序,就会帮助学生更快理解和掌握与“人工智能”的相关概念

这种类似于课程之间的“先修关系”落实到概念层面就是所述的“先决条件关系”。
概念间先决条件关系是建立先决条件关系网络的基础,这种先决条件关系网络其实就代表了这些概念知识的学习路径和学习顺序

而对概念先决条件关系的识别能够为构建领域知识网络,学习对象排序

习路径设计

课程计划的安排提供有效支持

[0003]目前,在现有技术中存在运用维基百科来挖掘概念之间的先决条件关系的技术方案


使用随机游走
random walk
以及
PageRank
算法来计算概念在网络中的重要程度值,最后通过最大熵分类器进行分类,找到熵值最大的条件,但其平均正确率只达到
60
%左右


通过
Concept graph learning(CGL)
构建通用的概念空间
(universal concepts space)
,使得任何的先决条件关系都可以使用该通用概念空间得出,落脚点依然在识别概念之间的关系层面上

因此,现有技术方案均存在所挖掘的概念之间的先决条件关系准确率较低的问题

[0004]由此,亟需一种新的技术方案以解决上述技术问题


技术实现思路

[0005]在
技术实现思路
部分中引入了一系列简化形式的概念,这将在具体实施方式部分中进一步详细说明

本专利技术的
技术实现思路
部分并不意味着要试图限定出所要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围

[0006]第一方面,本专利技术提出一种面向维基百科的概念先决条件关系挖掘方法,包括:
[0007]基于概念的属性,构建多组特征,其中,多组特征包括:基于链接的特征

基于类别的特征

基于内容的特征以及基于时间的特征;
[0008]利用多组特征,预测概念对之间的先决条件关系

[0009]可选地,方法还包括:
[0010]自维基百科中收集概念对并构建数据集;
[0011]利用数据集,评估预测得到的概念对之间的先决条件关系

[0012]可选地,在构建多组特征之前,方法还包括:
[0013]定义特征的相关元素,其中,元素包括概念的摘要部分,概念的同义词,概念的创建时间,摘要部分中指向其他概念的链接集,概念的类别集

[0014]可选地,链接包括:概念到概念的链接

集合到概念的链接以及集合到集合的链接;
[0015]利用多组特征,预测概念对之间的先决条件关系,包括:
[0016]利用概念到概念的链接特征公式,预测概念对之间的先决条件关系,其中,概念到概念的链接特征公式为:
A

B
表示一个概念对,表示概念
A
的摘要部分指向其他概念的链接集,
RefC(A

B)
表示基于概念到概念的链接特征确定的概念
A
和概念
B
之间的依赖程度;
[0017]利用集合到概念的链接特征公式,预测概念对之间的先决条件关系,其中,集合到概念的链接特征公式为:概念的链接特征公式为:
RefS(A

B)
表示基于集合到概念的链接特征确定的概念
A
和概念
B
之间的依赖程度;
[0018]利用集合到集合的链接特征公式,预测概念对之间的先决条件关系,其中,集合到集合的链接特征公式为:集合的链接特征公式为:
RefS
+
(A

B)
表示基于集合到集合的链接特征确定的概念
A
和概念
B
之间的依赖程度,
r(C

A)
表示概念
C
是指概念
A
的相关文章之一

[0019]可选地,类别包括:概念到概念的类别重叠

集合到概念的类别重叠以及集合到集合的类别重叠;
[0020]利用多组特征,预测概念对之间的先决条件关系,包括:
[0021]利用概念到概念的类别重叠特征公式,预测概念对之间的先决条件关系,其中,概念到概念的类别重叠特征公式为:
CatC(A

B)

Super(A

B)

Sub(A

B)

Super(A

B)

|K

(A)
∩f
K(B)
|

Sub(A

B)

|K

(A)
∩f
K(B)
|

K

(A)
表示
K
的直接父类的集合,
K

(A)
表示
K
的直接子类的集合,其中
K
属于概念
A
的类别集,
CatC(A

B)
表示基于概念到概念的类别特征确定的概念
A
和概念
B
之间的依赖程度;
[0022]利用集合到概念的类别重叠特征公式,预测概念对之间的先决条件关系,其中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种面向维基百科的概念先决条件关系挖掘方法,其特征在于,包括:基于所述概念的属性,构建多组特征,其中,所述多组特征包括:基于链接的特征

基于类别的特征

基于内容的特征以及基于时间的特征;利用所述多组特征,预测概念对之间的先决条件关系
。2.
如权利要求1所述的面向维基百科的概念先决条件关系挖掘方法,其特征在于,所述方法还包括:自所述维基百科中收集概念对并构建数据集;利用所述数据集,评估预测得到的所述概念对之间的先决条件关系
。3.
如权利要求1或2所述的面向维基百科的概念先决条件关系挖掘方法,其特征在于,在所述构建多组特征之前,所述方法还包括:定义所述特征的相关元素,其中,所述元素包括所述概念的摘要部分,所述概念的同义词,所述概念的创建时间,所述摘要部分中指向其他概念的链接集,所述概念的类别集
。4.
如权利要求3所述的面向维基百科的概念先决条件关系挖掘方法,其特征在于,所述链接包括:概念到概念的链接

集合到概念的链接以及集合到集合的链接;所述利用所述多组特征,预测概念对之间的先决条件关系,包括:利用概念到概念的链接特征公式,预测所述概念对之间的先决条件关系,其中,所述概念到概念的链接特征公式为:
A

B
表示一个概念对,表示概念
A
的摘要部分指向其他概念的链接集,
RefC(A,B)
表示基于概念到概念的链接特征确定的概念
A
和概念
B
之间的依赖程度;利用集合到概念的链接特征公式,预测所述概念对之间的先决条件关系,其中,所述集合到概念的链接特征公式为:合到概念的链接特征公式为:
RefS(A,B)
表示基于集合到概念的链接特征确定的概念
A
和概念
B
之间的依赖程度;利用集合到集合的链接特征公式,预测所述概念对之间的先决条件关系,其中,所述集合到集合的链接特征公式为:合到集合的链接特征公式为:
RefS
+
(A,B)
表示基于集合到集合的链接特征确定的概念
A
和概念
B
之间的依赖程度,
r(C,A)
表示概念
C
是指概念
A
的相关文章之一
。5.
如权利要求3所述的面向维基百科的概念先决条件关系挖掘方法,其特征在于,所述类别包括:概念到概念的类别重叠

集合到概念的类别重叠以及集合到集合的类别重叠;所述利用所述多组特征,预测概念对之间的先决条件关系,包括:利用概念到概念的类别重叠特征公式,预测所述概念对之间的先决条件关系,其中,所
述概念到概念的类别重叠特征公式为:
CatC(A,B)

Super(A,B)―Sub(A,B)

Super(A,B)

|K

(A)
∩f
K(B)
|,Sub(A,B)

|K

(A)
∩f
K(B)
|

K

(A)
表示
K
的直接父类的集合,
K

(A)
表示
K
的直接子类的集合,其中
K
属于概念
A
的类别集,
CatC(A,B)
表示基于概念到概念的类别特征确定的概念
A
和概念
B
之间的依赖程度;利用集合到概念的类别重叠特征公式,预测所述概念对之间的先决条件关系,其中,所述集合到概念的类别重叠特征公式为:
CatS(A,B)

【专利技术属性】
技术研发人员:肖奎吴天吉丁睿张䶮周洋
申请(专利权)人:湖北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1