用于构建教育技术领域本体库的术语标注系统技术方案

技术编号:6999411 阅读:325 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供用于构建教育技术领域本体库的术语标注系统,包括用于提供教育技术领域本体库的领域语料数据库,以及用户登录模块、句子标注模块、关系标注模块和标注统计模块。本发明专利技术的术语标注系统能够为《知识浓缩与融合关键技术》863项目提供元数据,目的是将教育技术学核心教材中的专业术语标注出来,并为术语标明关系(包括同义关系、类属关系、语义关系)。利用本发明专利技术所提供辅助,能够高效率标准化地完成教育技术领域本体库构建工作。

【技术实现步骤摘要】

本专利技术属于涉及信息
,特别涉及一种用于构建教育
本体库的术语标注系统。
技术介绍
本体有着多种不同的定义,其中最为著名的是由Gruber提出的,"本体是共享概念 模型的明确的规范说明"。此概念包括四个主要方面1)概念化客观世界中现象的抽象模 型;2)明确概念及它们之间的联系都被精确定义;3)形式化精确的数学描述;4)共享 本体中反映的知识是其使用者共同认可的。本体作为某个领域内(可以是特定领域的,也 可以是更广的范围)不同主体(人、代理、机器等)之间进行交流(对话、互操作、共享等) 的一种语义基础,即由本体提供明确定义的词汇表,描述概念和概念之间的关系,作为使用 者之间达成的共识。因此,本体的用途包括交流、共享、互操作、重用等等。领域是指一组具 有相似或相近软件需求的应用系统所覆盖的功能区域。领域概念是对特定术语集的抽象, 是一个从领域任务和领域本体中提取出来的知识集。领域本体是领域抽象的直接结果,它 是对领域知识的明确清晰的表达,通常用本体语言来进行表述。本体是一种概念体系,且本 体通常与领域相关,在一些特定的实际应用中,领域本体是很有必要的。对于信息
来讲,本体包括构造该领域所需要的概念词汇以及词汇之间相互关系的约束。本体的目标 是捕获相关领域的知识、信息,提供对该领域知识的共同理解。本体是现实对象在某一或某 些属性领域空间上的投影,任何本体都不能描述复杂现实对象的全部属性,只能根据领域 来刻画其某些侧面,本体是领域内重要实体、属性、过程及其相互关系形式化描述的基础, 可以在不同的建模方式、范式、语言和软件工具之间进行翻译和映射,以实现不同系统之间 的互操作和继承。相对于元模型而言,本体是领域相关和超领域描述的,这种形式化的描述 可成为遗留软件系统中可重用和共享的组件。 本体作为一种能在语义和知识层次上描述信息资源的概念模型建模工具,自被提 出以来就引起了国内外众多科研人员的关注,在许多领域得到了广泛的应用,如信息检索、 知识工程、软件复用,信息系统间异构信息处理等。领域本体研究如何定义特定领域中的概 念、概念之间的关系,提供该领域中发生的活动以及该领域的主要理论和基本原理等。 目前已经开发的领域本体主要包括企业本体、医学概念本体、酶催化生物医学本 体、电子商务供应链本体等。其中,企业本体(Enterprise Ontology)是大型企业建模基础 设施的一个重要组成部分,它覆盖了企业建模所有的核心概念。比较著名的企业本体研究 工作包括爱丁堡大学企业项目(Enterprise Project)和多伦多大学的虚拟企业(Virtual Enterprise)项目。在实际应用中,由于领域知识在不断演化、更新,所以要建立一个能够 涵盖领域内所有知识的本体是很困难甚至是不可能的。针对某个特定领域的应用需要,构 建领域本体的工作量非常庞大。对于信息
,国内外并没有一个比较系统全面的领 域本体库,而现有的本体大部分是通用性的本体,对具体领域内知识的揭示都不够全面、深入,拥有一个涵盖所有知识的本体是困难甚至是不可能的。由于知识的演化和更新,自动构建的领域本体也不可能包含领域内所有的概念知识。对基于本体的应用研究也都是假设本 体中包含了所需的全部知识,系统对本体有很强的依赖性。 为了弥补教育
的领域本体空白,急需构建教育
本体库。教育技 术领域本体库需要立足教育领域,面向教育资源;充分考虑教育资源分布的局域性、集中性和专业性;它不只是为高等教育研究服务,而且是高等教育事业的一个强有力的决策支持库,能使高等教育决策科学化、合理化提高到一个新水平。但是,如何高效率地构建教育技 术领域本体库,是信息
亟待解决的技术问题。
技术实现思路
本专利技术目的在于解决现有技术不足,提出了一种术语标注系统,以求辅助应用于 教育
的领域本体的构造。 本专利技术提供的技术方案为,一种用于构建教育
本体库的术语标注系统包 括用于提供教育
本体库的领域语料数据库,以及用户登录模块、句子及标注模块、 关系标注模块和标注统计模块;其中,句子及标注模块、关系标注模块和标注统计模块分别 与领域语料数据库相关联; 用户登录模块,用于用户登录,并在用户要求进行句子标注时调用句子标注模块, 在用户要求进行关系标注时调用关系标注模块; 句子及标注模块,用于支持用户从教育技术学电子教材中挑选句子,支持用户挑 选句子中的术语,并且支持用户对句子和术语进行编辑;用户已挑选或编辑的句子和术语 存入领域语料数据库; 关系标注模块,用于支持用户从领域语料数据库调用其中存放的术语并挑选构成 术语对,支持用户为术语对挑选术语关系,并且支持用户对术语关系进行编辑;所述术语关 系包括同义关系、类属关系或语义关系;用户已挑选或编辑的术语关系存入领域语料数据 库; 标注统计模块,用于响应用户查询统计的请求,从领域语料数据库调用其中存放的与请求相应的句子、术语和术语关系,统计句子个数、术语个数和术语关系个数。 而且,句子标注模块支持用户从教育技术学电子教材中挑选出一个句子时为句子编号,支持用户通过编号调用句子后进行编辑修改。 本专利技术的术语标注系统是为《知识浓縮与融合关键技术》863项目提供元数据的系 统,目的是将教育技术学核心教材中的专业术语标注出来,并为术语标明关系(包括同义 关系、类属关系、语义关系),从而形成教育技术学领域的术语库。利用本专利技术所提供辅助, 能够高效率标准化地完成教育
本体库构建工作。附图说明 图1为本专利技术的术语标注系统; 图2为本专利技术的术语关系选择示意图; 图3为本专利技术实施例的前台用户系统用例图; 图4为本专利技术实施例的后台用户系统用例图; 图5为本专利技术实施例的领域语料数据库中数据结构示意图。具体实施例方式为了提供教育
本体库,本专利技术首先进行了分析 (1)领域信息的收集和分析 我们知道,对于一个领域本体来说,真正只属于自己领域内的核心概念是不多的, 大量的概念都来源于这个领域的上位学科和通用性质的概念。也就是说,要构建真正的领 域本体,是不可能撇开其他领域概念不谈的。这好比是一座金字塔,没有深厚坚实的基础就 不能建造起塔顶所以领域本体也决不可能是"空中楼阁"。虽然其他领域概念的定义不属于 教育技术学领域,但是它们和教育技术学的关系却是构建教育技术学领域本体所无法回避 的。面对这样的问题,我们在实践中不求大而全,以实用为目的,只要提出领域本体中比较 重要的核心概念和关系,以便今后的扩展。教育技术学领域本体库主要由其八门主干课程 及专业学术期刊构成。八门主干课程为教育技术学、教学系统设计、教育技术学研究方法、 远程教育学、教育信息处理、信息技术与教育、网络教育应用教程、教学媒体的理论与实践。 专业学术期刊为08年电化教育研究,共245篇论文。以保证该本体中收录概念的覆盖面、 概念和关系的通用性。因此,本专利技术实施例采用八门主干课程及专业学术期刊的电子文本 作为术语标注的基础来源,即教育技术学电子教材。 (2)判断概念对的层次关系 通过领域信息的收集和分析,得到教育技术学领域重要概念知识结构。其中,概念 之间的关系我们主要考虑同义、层次分类、语义联系3种关系类型,参见图本文档来自技高网
...

【技术保护点】
一种用于构建教育技术领域本体库的术语标注系统,包括用于提供教育技术领域本体库的领域语料数据库,以及用户登录模块、句子及标注模块、关系标注模块和标注统计模块;其中,句子及标注模块、关系标注模块和标注统计模块分别与领域语料数据库相关联;用户登录模块,用于用户登录,并在用户要求进行句子标注时调用句子标注模块,在用户要求进行关系标注时调用关系标注模块;句子及标注模块,用于支持用户从教育技术学电子教材中挑选句子,支持用户挑选句子中的术语,并且支持用户对句子和术语进行编辑;用户已挑选或编辑的句子和术语存入领域语料数据库;关系标注模块,用于支持用户从领域语料数据库调用其中存放的术语并挑选构成术语对,支持用户为术语对挑选术语关系,并且支持用户对术语关系进行编辑;所述术语关系包括同义关系、类属关系或语义关系;用户已挑选或编辑的术语关系存入领域语料数据库;标注统计模块,用于响应用户查询统计的请求,从领域语料数据库调用其中存放的与请求相应的句子、术语和术语关系,统计句子个数、术语个数和术语关系个数。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄涛刘清堂周莲周旭东楮小念
申请(专利权)人:华中师范大学
类型:发明
国别省市:83

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1