【技术实现步骤摘要】
一种基于网络嵌入的课程图谱构建方法
本专利技术涉及概念先决关系推导、在线教育和知识图谱领域,更具体地,涉及一种基于网络嵌入的课程图谱构建方法。
技术介绍
互联网技术的高速发展,使得越来越多的传统行业开始往互联网化的模式转变,在这些行业中,教育行业也借助着网络的便利开始大力地发展。著名的教育平台,包括国内的慕课网,网易云课堂,中国大学MOOC等以及国外的Coursera,TED,iTunesU,MITOaenCourseware等。这些网站涵盖了各个学科领域的知识,学习者通过这些在线学习平台,在国内甚至在家里,就能学习到世界名校的课程或者得到行业优秀从业人员的指点。高性能计算(Hign-performanceComputing)是计算机领域下的一个重要领域,也是目前受到非常多关注的新兴学科。它利用超级计算机实现并行计算的理论、方法、技术以及应用,围绕利用不断发展的并行处理单元以及并行体系架构实现高性能并行计算这一核心问题,可以应用于军事、气候、天体物理、生命科学等众多领域。但是目前,国内关于高性能计算的基础教育平台并不多。r>在在线教育网站中本文档来自技高网...
【技术保护点】
1.一种基于网络嵌入的课程图谱构建方法,其特征在于,包括以下步骤:/nS1.概念提取模块从在线的学习网站上爬取课程描述和章节名称,通过分词过滤获得领域概念集合;对领域概念集进行短语的过滤筛选,获得目标课程的概念词;/nS2.网络嵌入模块,根据概念提取模块所得的概念词,定义概念词的文本集合和先决概念,通过网络嵌入方法学习概念表示,定义结构向量v
【技术特征摘要】
1.一种基于网络嵌入的课程图谱构建方法,其特征在于,包括以下步骤:
S1.概念提取模块从在线的学习网站上爬取课程描述和章节名称,通过分词过滤获得领域概念集合;对领域概念集进行短语的过滤筛选,获得目标课程的概念词;
S2.网络嵌入模块,根据概念提取模块所得的概念词,定义概念词的文本集合和先决概念,通过网络嵌入方法学习概念表示,定义结构向量vs和文本向量vt,将结构向量vs和文本向量vt置于神经网络进行学习,得概念向量集合;
S3.课程关系推导模块,根据上述所得的输出课程先导关系;
S4.图谱构建模块通过数据结构和可视化的技术构建直观的课程图谱。
2.根据权利要求1所述的一种基于网络嵌入的课程图谱构建方法,其特征在于,所述的S1的具体步骤如下:
S11.从在线的学习网站上爬取课程描述和章节名称,作为语料库,通过Python分词工具对语料库进行分词,过滤停用词;
S12.通过n-gram模型获得长度分别为1,2和3的短语,根据公知的领域词条对语料库词语进行监督过滤,得到领域词条候选集并经过领域专家进行人工筛选,得到领域概念集合C={c1,c2,...,cn},其中n是概念的数量;
S13.对目标课程进行分词,过滤停用词的操作,再通过n-gram模型获得长度分别为1,2和3的短语,根据S12所得的领域概念集合对短语进行筛选过滤,获得最终目标课程的概念词。
3.根据权利要求2所述的一种基于网络嵌入的课程图谱构建方法,其特征在于,所述的S2的具体步骤如下:
S21.定义T={t1,t2,...,tn}为解释概念的文本集合,T的下标与C的下标一一对应,ti是概念ci的解释文本;
S22.定义概念网络Nc(C,L),该网络中的每一个节点表示领域概念集合C中的一个概念,节点之间的边是有向的,表示概念之间的先决关系,则节点间的有向边称作概念的连接,其中L是所有连接的集合,设概念cs是ct的先决概念,则L包含连接lst=(cs,ct);
S23.将概念表示为概念向量同时将概念向量v分为基于概念节点所处网络的位置学习得到的结构向量vs与基于概念节点的文本信息学习得到的文本向量vt;
S24对于概念cs,假设已知的cs的先决概念集为Cpre(cs),以cs作为先决概念的概念集为Cpos(cs);设表示cs的先决概念与cs的连接集合;表示以cs作为先决概念的连接集合;
S25.若存在连接lsi=(cs,ci),设cs的结构向量表示为文本向量表示为ci的结构向量表示为文本向量表示为
S26.为提取向量作为的先决关系的结构化特征,定义基于结构的目标函数,如式(2-1)所示:
其中是由向量得到的条件概率,定义如下:
上式中的V={v1,v2,...,vn}表示全体概念向量的集合;
S27.根据上述定义得到计算概念cs的结构向量的目标函数为:
S28.为提取向量作为的先决关系的文本特征,定义基于文本的目标函数:
S29.计算概念cs的文本向量的目标函数为:
S210.结合基于结构目标函数和基于文本目标函数,得到计算概念cs的向量表示的目标函数为:
S211.由此得到网络嵌入模型的训练过程旨在最大化目标函数(...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。