一种知识点关联方法及系统技术方案

技术编号:11783510 阅读:69 留言:0更新日期:2015-07-28 00:04
本发明专利技术公开了一种知识点关联方法及系统,属于互联网技术中的数据挖掘领域,包括:获取待加入已有知识体系结构的学科术语,根据待加入学科术语与该领域的已有知识体系结构中的学科术语之间的相似度,确定待加入学科术语在体系结构中的位置,完善已有知识体系结构;获取待提取知识点的语料中的学科术语,并计算每个学科术语的重要度;最后根据学科术语的重要度和其在已有知识体系结构中的位置,计算已有知识体系结构中节点位置的权重,将权重最大的节点位置处的学科术语确定为所述语料的知识点。该方法及系统实现了对已有知识体系结构不断完善,能够为用户匹配出最相关的知识点,以便为用户推荐与所述知识点相关的资源,提高了用户的感知。

【技术实现步骤摘要】

本专利技术涉及互联网技术中的数据挖掘领域,具体涉及一种基于知识体系结构的知 识点关联方法及系统。
技术介绍
随着互联网技术的不断发展,在线教育系统得到了普及。在线教育为很多学习者 提供了更多的机会,用户可以找到自己感兴趣的内容。这样的方式在一定程度上解决了传 统教育过于死板,内容单一,教育资源分配不均匀,不开放的问题,为更多的人提供了学习 的平台,为推动社会教育产业的发展有着积极的作用。受教育者会有这样的需求:对于一段 学习资料,如果能够标注出其中的知识点,根据这些知识点,为受教育者推荐学术论文或一 些学习资源,就会进一步明确学习目标,大大提高他们的学习效率。为受教育者推荐与语料 提及知识点相关的学术资源,无疑是一项非常有意义的工作。 而就目前而言,知识点的识别,在线教育服务机构大多数采用手工标注的方式, 让一些有教学经验的老师标注出语料中的学科知识点,而这样的方法,主要有以下几点缺 陷: (1)教育学科类别非常丰富,每个学科教育资源数量非常庞大,手工标注的方式会 浪费大量的人力成本和时间成本。 (2)手工标注的方式,存在一定的遗漏。同时,事实证明,即使是经验丰富的老教 师,标注的知识点统一性较差,随意性大。 (3)对于新的学科和新的知识,反应速度较慢,不具备可扩展性。 本专利技术正是针对现有在线数字教育中缺乏统一的知识体系、以及依赖大量人工标 注进行教材教辅资源关联的问题,研宄基于现有数字教学资源的知识体系构建针对大规模 教材教辅资源的知识点自动关联技术,最终构建面向教育信息化的基础教育知识应用框 架,并根据语料内容为用户推荐相关知识点。【
技术实现思路
】 针对现有技术中存在的缺陷,本专利技术的目的在于提供一种知识点关联方法及系 统,通过该方法及系统,能够快速准确的匹配出用户所阅读的语料中的知识点。 为实现上述目的,本专利技术采用的技术方案如下: 一种知识点关联方法,包括以下步骤: (1)获取某一领域中待加入该领域已有知识体系结构的学科术语,根据待加入学 科术语与所述领域的已有知识体系结构中的学科术语之间的相似度,确定待加入学科术语 在已有知识体系结构中的节点位置,完善已有知识体系结构; (2)获取待提取知识点的语料中的学科术语,并计算获取到的每个学科术语的重 要度; (3)查找语料中的学科术语在所述语料所属领域的已有知识体系结构中的节点位 置,根据语料中学科术语的重要度和其在已有知识体系结构中的节点位置,计算已有知识 体系结构中每个节点位置的权重,将权重最大的节点位置处的学科术语确定为待提取知识 点的语料的知识点。 进一步,如上所述的一种知识点关联方法,步骤(1)中,所述确定待加入学科术语 在已有知识体系结构中的节点位置是指在该学科术语所属领域的已有知识体系结构中,确 定待加入学科术语的父节点的位置,如果待加入学科术语与所述已有知识体系结构中某一 学科术语之间的相似度大于设定阈值,则确定所述某一学科术语为待加入学科术语的父节 点。 进一步,如上所述的一种知识点关联方法,步骤(1)中,学科术语之间的相似度包 括学科术语之间的表征相似度和语义相似度;所述表征相似度是指学科术语的构成上的相 似度; 学科术语X与其所述领域的已有知识体系结构中学科术语y之间的相似度 fatherProb(x,y)的计算公式为: fatherProb(x,y) =ayXeditSimi(x,y) + 0yXsemanticFatherSimi(x,y) 其中,editSimi(x,y)为学科术语x与学科术语y之间的表征相似度, semanticFatherSimi(X,y)学科术语X与学科术语y的所有子节点的学科术语之间的平均 语义相似度,ay为表征相似度的权重,0y为平均语义相似度的权重; 根据两个学科术语之间的编辑距离计算学科术语之间的表征相似度,学科术语X 与学科术语y之间的表征相似度editSimi(X,y)计算公式为:【主权项】1. 一种知识点关联方法,包括w下步骤: (1) 获取某一领域中待加入该领域已有知识体系结构的学科术语,根据待加入学科术 语与所述领域的已有知识体系结构中的学科术语之间的相似度,确定待加入学科术语在已 有知识体系结构中的节点位置,完善已有知识体系结构; (2) 获取待提取知识点的语料中的学科术语,并计算获取到的每个学科术语的重要 度; (3) 查找语料中的学科术语在所述语料所属领域的已有知识体系结构中的节点位置, 根据语料中学科术语的重要度和其在已有知识体系结构中的节点位置,计算已有知识体系 结构中每个节点位置的权重,将权重最大的节点位置处的学科术语确定为待提取知识点的 语料的知识点。2. 根据权利要求1所述的一种知识点关联方法,其特征在于,步骤(1)中,所述确定待 加入学科术语在已有知识体系结构中的节点位置是指在该学科术语所属领域的已有知识 体系结构中,确定待加入学科术语的父节点的位置,如果待加入学科术语与所述已有知识 体系结构中某一学科术语之间的相似度大于设定阔值,则确定所述某一学科术语为待加入 学科术语的父节点。3. 根据权利要求2所述的一种知识点关联方法,其特征在于,步骤(1)中,学科术语之 间的相似度包括学科术语之间的表征相似度和语义相似度;所述表征相似度是指学科术语 的构成上的相似度; 学科术语X与其所述领域的已有知识体系结构中学科术语y之间的相似度fathe;rP;rob(x,y)的计算公式为; fatherProb(X,y) =aeditSimi(x,y) +PsemanticFatherSimi(x,y) 曰y+0y= 1 其中,editSimi(X,y)为学科术语X与学科术语y之间的表征相似度,semanticFatherSimi(X,y)学科术语X与学科术语y的所有子节点的学科术语之间的平均 语义相似度,ay为表征相似度的权重,0y为平均语义相似度的权重; 根据两个学科术语之间的编辑距离计算学科术语之间的表征相似度,学科术语X与学 科术语y之间的表征相似度editSimi(X,y)计算公式为;其中,editDistance(x,y)表示学科术语X与学科术语y之间的编辑距离,length(y) 表示学科术语y的当前第1页1 2 本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/55/CN104794168.html" title="一种知识点关联方法及系统原文来自X技术">知识点关联方法及系统</a>

【技术保护点】
一种知识点关联方法,包括以下步骤:(1)获取某一领域中待加入该领域已有知识体系结构的学科术语,根据待加入学科术语与所述领域的已有知识体系结构中的学科术语之间的相似度,确定待加入学科术语在已有知识体系结构中的节点位置,完善已有知识体系结构;(2)获取待提取知识点的语料中的学科术语,并计算获取到的每个学科术语的重要度;(3)查找语料中的学科术语在所述语料所属领域的已有知识体系结构中的节点位置,根据语料中学科术语的重要度和其在已有知识体系结构中的节点位置,计算已有知识体系结构中每个节点位置的权重,将权重最大的节点位置处的学科术语确定为待提取知识点的语料的知识点。

【技术特征摘要】

【专利技术属性】
技术研发人员:杨硕高飞冯岩松贾爱霞赵东岩卢作伟王冬
申请(专利权)人:明博教育科技有限公司北京大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1