面向分布式学习环境的多片段学习资源标注方法技术

技术编号:11230915 阅读:101 留言:0更新日期:2015-03-29 18:25
本发明专利技术涉及一种面向分布式学习环境的多片段学习资源标注方法,其主要解决现有学习资源标注技术由于不能对电子学习资源的片段进行标注导致学习者不能准确查找并定位所需要的学习资源的问题,通过(1)定义资源片段本体;(2)确定可用于资源片段标注的其他本体;(3)学习资源及学习资源片段的标注;(4)标注后的学习资源的发布四个步骤实现,本发明专利技术能够从媒体形式上对不同类型的学习资源进行描述,同时结合学习内容描述本体和领域本体,从表现形式上和学习内容上共同对电子学习资源进行标注,具有标注结果准确规范、易于访问、可有效提高学习资源搜索的针对性的优点,可用于电子学习资源管理、Web语义检索等领域。

【技术实现步骤摘要】
面向分布式学习环境的多片段学习资源标注方法
本专利技术属于Web数据管理
,具体是一种基于学习资源片段本体的语义标注,实现对各种类型学习资源及学习资源部分片段的语义标注的面向分布式学习环境的多片段学习资源标注方法。
技术介绍
电子学习平台应用的普及和社会网络应用的繁荣使得Web上聚集了越来越多的学习资源,这些数字化的学习资源具有不同的类型,如文本、视频、音频、图像等。为了方便学习者发现并使用这些资源,资源发布者一般会给学习资源添加标签。通过搜索引擎等检索服务,可发现使用与查询关键词相匹配的资源标签所标注的学习资源。学习者能否在Web上找到符合自己需求的学习资源并进行相互交流,资源语义标注的形式和访问方式起到了关键性的作用。在很多情况下,学习者希望获取的并不是完整的资源而只是一个或多个资源的片段。例如,学习者只关心某个幻灯片的部分页面,或者只需要看一个教学视频中的特定几分钟的讲解。在这种情况下,如果返回给学习者一个完整的资源是不能完全满足其要求的。因此,对学习资源的标注必须是多方位多层次的,以提高学习资源标注的准确性,同时增强学习资源的可访问性。现有的对学习资源进行语义标注的技术主要分为以下三种。第一种,基于社会网络标签的学习资源标注。HendS.Al-Khalifa和HughC.Davis在论文“FolksAnnotation:ASemanticMetadataToolforAnnotatingLearningResourcesUsingFolksonomiesandDomainOntologies”(《ProceedingsoftheSecondInternationalConferenceonInnovationsinInformationTechnology》2006,1:5)中提出了使用Folksonomy即标签集合标注学习资源的方法。该方法的核心步骤包括:(1)从标签数据库中抽取标签并进行标准化;(2)产生语义元数据对学习资源进行标注。这也是基于标签的语义标注方法通常都遵循的步骤。尽管标签容易理解,但是,这类方法的主要缺陷在于标签词汇的不规范,会导致标注的语义不清楚、歧义等问题。同时这类方法也仅限于标注完整的学习资源,不支持对资源片段的标注。第二种,基于学习本体的学习资源语义标注。相对于标签,本体支持形式化、规范的语义,基于本体的学习资源标注方法可以克服标签语义上存在的问题。其具有和基于标签的方法相似的步骤:(1)选择可用于标注的本体;(2)使用本体词汇进行标注。学习本体的选择是这类方法的核心。杨现民和余胜泉在论文“泛在学习环境下的学习资源信息模型构建”(《中国电化教育》2010,24(9):72-78)中系统地分析了现有学习本体在描述学习资源上的能力与不足,并提出了学习元信息模型,能够相对全面的表达学习资源和学习者各个方面的特性,但是仍然没有对学习资源片段进行描述的能力。由于缺少对资源片段进行规范描述的语义元数据,因此目前基于本体的学习资源标注方法也不能满足学习者只关注部分学习资源的需求。第三种,基于关联数据的学习资源描述与发布。StefanDietze和HonqQingYu等人在论文“LinkedEducation:interlinkingeducationalResourcesandtheWebofData”(《InProceedingsofSAC》2012,366:372)中提出了使用关联数据(LinkedData)的形式将学习资源进行互联,从而提供了一种学习资源访问的便捷途径。关联数据形式的学习资源包含了领域本体所提供的一些语义信息,通过URI可以对资源进行访问以支持分布式的电子学习平台,同时还可以使用SPARQL语言对资源进行查询。但是查询的粒度也是针对使用URI标识的资源,在没有对学习资源片段进行URI标识的条件下,关联数据形式的学习资源组织也不能够完全满足学习者查询学习资源的需求。
技术实现思路
本专利技术的目的在于克服上述技术所存在的不足,提出一种基于学习资源片段本体,以实现根据学习者需求对Web中的学习资源进行不同粒度级别的语义标注,从而提高学习资源的使用效率,支持社会网络环境下学习过程中的自由交流的面向分布式学习环境的多片段学习资源标注方法。为了实现上述目的,本专利技术所采用的技术方案是由以下步骤组成:(1)定义资源片段本体将学习资源片段作为标记的最小单位,根据承载学习资源的媒体类型,将学习资源分为连续型媒体资源和离散型媒体资源,若为连续型媒体资源,在其所包含的动画、音频和视频资源上定义时间片段,并将时间片段划分为时间点片段和时间区间片段;若为离散型媒体资源,在其所包含的图像资源上定义空间片段、在非结构化文本资源上定义非结构化段落片段、在结构化文本资源上定义结构化片段,并将结构化片段进一步划分为结构化查询片段、路径片段和资源描述框架三元组查询片段;用上述定义的时间点片段、时间区间片段、空间片段、非结构化段落片段、结构化查询片段、路径片段、资源描述框架三元组查询片段作为概念词汇来描述资源片段结构;用上述的动画、音频、视频、图像的资源以及非结构化文本资源、结构化文本资源作为概念词汇来描述资源片段的显示效果;(2)确定可用于资源片段标注的其他本体对于已有的多媒体、电子学习领域的技术标准和本体,检索其中可用于描述学习资源片段媒体信息特征和学习资源内容特征的本体,用其中的概念词汇对该学习资源片段媒体信息特征和学习资源内容特征进行描述;(3)学习资源及学习资源片段的标注用户根据目标内容选择标注类型,对于完整的学习资源,用步骤(2)中的用于描述学习资源片段媒体信息特征和学习资源内容特征的概念词汇来标注,同时支持用户自定义词汇标注;对于用户根据需求所确定的可重复使用的资源片段,使用步骤(1)中的描述资源片段的结构和显示效果的概念词汇对资源片段进行表述,并使用步骤(2)中用于描述学习资源片段媒体信息特征和学习资源内容特征的概念词汇来标注,同时支持用户自定义词汇标注;(4)标注后的学习资源的发布根据URI命名方式对步骤(3)中已标注的完整学习资源和资源片段进行命名,将步骤(3)的标注结果转化为资源描述框架三元组数据模型,在相互有关联的URI之间建立owl:sameAs形式的链接关系,完成已标注学习资源的发布,具体是:(4.1)根据URI命名方式对步骤(3)中已标注的完整学习资源和资源片段进行命名;(4.2)对于每一个已命名的学习资源或资源片段s,分别确定已标注词汇可作用于资源片段s上的属性pi及其对应取值oi,生成资源描述框架三元组描述集合{(s,pi,oi)};(4.3)将对所有学习资源和资源片段所生成的资源描述框架三元组描述集合{(s,pi,oi)}中任意两个进行比较,计算其相关系数;(4.4)设定相似性阈值,若资源对(si,sj)的相关系数大于等于相似性阈值,使用owl:sameAs建立两者之间的链接关系,若资源对(si,sj)的相关系数小于相似性阈值,则放弃建立链接关系。在上述步骤(4.3)中任意两个资源进行比较,计算其相关系数,具体是:(4.3.1)先建立资源描述框架数据集的“属性-值”模型,一个资源描述框架数据集中的资源通过一个特征集合rfs表示,rfs中的每一个特征都关联本文档来自技高网
...
面向分布式学习环境的多片段学习资源标注方法

【技术保护点】
一种面向分布式学习环境的多片段学习资源标注方法,其特征在于由以下步骤组成:(1)定义资源片段本体将学习资源片段作为标记的最小单位,根据承载学习资源的媒体类型,将学习资源分为连续型媒体资源和离散型媒体资源,若为连续型媒体资源,在其所包含的动画、音频和视频资源上定义时间片段,并将时间片段划分为时间点片段和时间区间片段;若为离散型媒体资源,在其所包含的图像资源上定义空间片段、在非结构化文本资源上定义非结构化段落片段、在结构化文本资源上定义结构化片段,并将结构化片段进一步划分为结构化查询片段、路径片段和资源描述框架三元组查询片段;用上述定义的时间点片段、时间区间片段、空间片段、非结构化段落片段、结构化查询片段、路径片段、资源描述框架三元组查询片段作为概念词汇来描述资源片段结构;用上述的动画、音频、视频、图像的资源以及非结构化文本资源、结构化文本资源作为概念词汇来描述资源片段的显示效果;(2)确定可用于资源片段标注的其他本体对于已有的多媒体、电子学习领域的技术标准和本体,检索其中可用于描述学习资源片段媒体信息特征和学习资源内容特征的本体,用其中的概念词汇对该学习资源片段媒体信息特征和学习资源内容特征进行描述;(3)学习资源及学习资源片段的标注用户根据目标内容选择标注类型,对于完整的学习资源,用步骤(2)中的用于描述学习资源片段媒体信息特征和学习资源内容特征的概念词汇来标注,同时支持用户自定义词汇标注;对于用户根据需求所确定的可重复使用的资源片段,使用步骤(1)中的描述资源片段的结构和显示效果的概念词汇对资源片段进行表述,并使用步骤(2)中用于描述学习资源片段媒体信息特征和学习资源内容特征的概念词汇来标注,同时支持用户自定义词汇标注;(4)标注后的学习资源的发布根据URI命名方式对步骤(3)中已标注的完整学习资源和资源片段进行命名,将步骤(3)的标注结果转化为资源描述框架三元组数据模型,在相互有关联的URI之间建立owl:sameAs形式的链接关系,完成已标注学习资源的发布。...

【技术特征摘要】
1.一种面向分布式学习环境的多片段学习资源标注方法,其特征在于由以下步骤组成:(1)定义资源片段本体将学习资源片段作为标记的最小单位,根据承载学习资源的媒体类型,将学习资源分为连续型媒体资源和离散型媒体资源,若为连续型媒体资源,在其所包含的动画、音频和视频资源上定义时间片段,并将时间片段划分为时间点片段和时间区间片段;若为离散型媒体资源,在其所包含的图像资源上定义空间片段、在非结构化文本资源上定义非结构化段落片段、在结构化文本资源上定义结构化片段,并将结构化片段进一步划分为结构化查询片段、路径片段和资源描述框架三元组查询片段;用上述定义的时间点片段、时间区间片段、空间片段、非结构化段落片段、结构化查询片段、路径片段、资源描述框架三元组查询片段作为概念词汇来描述资源片段结构;用上述的动画、音频、视频、图像的资源以及非结构化文本资源、结构化文本资源作为概念词汇来描述资源片段的显示效果;(2)确定可用于资源片段标注的其他本体对于已有的多媒体、电子学习领域的技术标准和本体,检索其中可用于描述学习资源片段媒体信息特征和学习资源内容特征的本体,用其中的概念词汇对该学习资源片段媒体信息特征和学习资源内容特征进行描述;(3)学习资源及学习资源片段的标注用户根据目标内容选择标注类型,对于完整的学习资源,用步骤(2)中的用于描述学习资源片段媒体信息特征和学习资源内容特征的概念词汇来标注,同时支持用户自定义词汇标注;对于用户根据需求所确定的可重复使用的资源片段,使用步骤(1)中的描述资源片段的结构和显示效果的概念词汇对资源片段进行表述,并使用步骤(2)中用于描述学习资源片段媒体信息特征和学习资源内容特征的概念词汇来标注,同时支持用户自定义词汇标注;(4)标注后的学习资源的发布根据URI命名方式对步骤(3)中已标注的完整学习资源和...

【专利技术属性】
技术研发人员:袁柳陈健王凡段俊杰陈慧君
申请(专利权)人:陕西师范大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1