一种适用于网络学术资源永久存档及使用的元数据方案制造技术

技术编号:6559431 阅读:177 留言:0更新日期:2012-04-11 18:40
本发明专利技术揭示了一种适用于网络学术资源永久存档及使用的元数据方案,属于信息存储与检索技术领域。本方案针对网络学术资源的特点,在都柏林核心元数据集进行了扩展,引入了资源类型、机构、集合名等8个关键扩展元素,能够有效地支持网络学术资源的揭示、存储与检索。

【技术实现步骤摘要】

本专利技术是一种适用于网络学术资源永久存档及使用的元数据方案,可应用到互联网上学 术性资源的揭示、永久存档及使用。在学科上属于现代图书馆学、情报学范畴。
技术介绍
网络学术资源是互联网上的和学术有关的数字化资源。网络学术资源数量巨大,种类繁 多,学科覆盖面广,并且具有一定的学术价值,是传统学术资源,例如学术期刊的重要补充互联网动态的本性决定了网络学术资源具有易变性,往往会出现链接失效等问题,永久 存档相当困难;而且,互联网的共享性与开放性也使得人人都可以在互联网上发布学术资源 ,如此一来, 一方面导致资源组织的混乱无序,另一方面又使得其质量良莠不齐。在这样的 背景下,建立有针对性的元数据规范,对互联网学术资源进行系统化梳理,其意义更显重大元数据是描述数据的数据(data that describes data)或"关于数据的数据"(data about data),用于描述数据库的特征与属性,也是描述和组织信息资源的工具。但在图书 馆学与情报学中,元数据已广泛用到图书、期刊、会议、法规、资讯和各种资源的描述。在 现代图书馆中,已基本完成了MARC (MachineReadableCatalog:以代码形式和特定结构记录 在计算机存储载体上的、用计算机识别与阅读的目录)的规范制定。这套规范对图书的永 久存档起到了至关重要的作用;但因为它是针对图书的特点来制定的,并不适用于网络学术 资源。本方案的专利技术,就是为了解决网络学术资源在图书情报方面的应用而产生的。制定一套可行的元数据方案,是一项复杂的基础设施型工程不仅需要由多方面的专家 参与,并且需要长时间的应用检验才能定型。本套元数据方案充分借鉴了都柏林核心元数据 集规范并凝聚了我们长期的网络学术资源整理建库的经验。
技术实现思路
本专利技术揭示了一种适用于网络学术资源永久存档及使用的元数据方案,属于信息存储与 检索
本方案针对网络学术资源的特点,在都柏林核心元数据集进行了扩展,引入3了资源类型、机构、集合名等8个关键扩展元素,能够有效地支持网络学术资源的揭示、存 储与检索。本方案的元数据元素集合定义如下 (1)核心元素(8个)元素名称资源类型定义网络学术资源的类型注释对资源按照内容分为论文类、报告类、会议记录、议题议案、专栏评述、法规标 准、新产品资讯、电子书、教学材料、机构出版物、专利等十一大类。 元素名称机构 定义资源创建者的机构名称 注释创建者(Creator)所在的机构名称。 元素名称集合名称定义连续出版、发表的系列内容统称为某一集合,集合名称指这一集合的名称。 注释如会议录名称、会议名称、期刊名称、报纸名称等。 元素名称系列号定义集合中每一个资源的连续号码注释有科技报告号、合同编号、会议录编号、书号、刊号、专利号、标准号等。 元素名称地域定义资源发表机构地址或创建者所处地域名称。注释国别及(或)城市。指会议的举办地,论文作者所在机构的地址,网站所在地, 产品所属公司的属地,等等。 元素名称本地镜像地址定义网络学术资源在本地网络上的镜像地址。注释本地网络由多个镜像站点组成,每份资源在多个站点上都有镜像。 术语名称中心镜像地址定义网络学术资源在中心镜像站上的镜像地址。注释中心镜像站是指提供所有可用网络学术资源镜像的一组服务器组。是大而全的镜 像站。术语名称评分值定义每个资源的重要性评分值。注释由一套重要性评分系统给出的每个资源的重要性评分值。 (2)其余元素(都柏林核心数据集的元素,15个) 元素名称其他责任者(contributor) 定义对资源的内容做出贡献的其他实体。注释其他责任者的实例可包括个人、组织或某项服务。一般而言,用其他责任者的 名称来标识这一条目。元素名称覆盖范围(coverage) 定义资源内容所涉及的外延或范围。注释覆盖范围一般包括空间位置(一个地名或地理坐标)、时间区间(一个时间标识、日期或一个日期范围)或者行政辖区的范围(比如指定的一个行政实体)。推荐覆盖范围最好是取自于一个受控词表(例如地理名称叙词表),并应尽可能地使用由数字表 示的坐标或日期区间来描述地名与时间段。 元素名称创建者(creator) 定义创建资源内容的主要责任者。注释创建者的实例包括个人、组织或某项服务。一般而言,用创建者的名称来标识这一条目。元素名称日期(date) 定义与资源生命周期中的一个事件相关的时间。注释 一般而言,日期应与资源的创建或可获得的日期相关。建议采用的日期格式应 符合IS0 8601 规范,并使用YYYY-丽-DD的格式。 元素名称描述(description) 定义资源内容的解释。注释描述可以包括但不限于以下内容文摘、目录、图像的文字说明、或者一个关 于资源内容的文本描述。元素名称格式(format)定义资源的物理或数字表现形式。注释 一般而言,格式可以包括资源的媒体类型或资源的大小,格式元素可以用来决 定展示或操作资源所需的软硬件或其他相应设备。例如资源的大小包括资源所占的存储空间或持续时间。建议采用来自于受控词表中的值(例如Internet媒体类型定义的计算机 媒体格式)。元素名称标识符(identifier) 定义在特定的范围内给予资源的一个明确的标识。注释建议对资源的标识采用符合某一正式标识体系的字符串及数字组合。正式的标识体系的实例包括统一资源标识符(URI)(包括统一资源定位符URL)、数字对象标识符 (DOI)和国际标准书号(ISBN)等。 元素名称语禾中(language)定义描述资源知识内容的语种。 注释建议本元素的值采用RFC3066,该标准与IS0639 —起定义了 由两个或三个英文字母组成的主标签和可选的子标签来标识语种。例如用"en"或"eng" 来表示English, "akk" 来表示Akkadian, "en-GB"表示英国英语。 元素名称出版者(publisher) 定义使资源成为可获得的责任实体。注释出版者的实例包括个体、组织或服务。一般而言,应该用出版者的名称来标识这一条目。元素名称关联(relation)定义对相关资源的参照。注释建议最好使用符合规范标识体系的字符串或数字来标识所要参照的资源 元素名称权限(rights) 定义有关资源本身所有的或被赋予的权限信息。注释 一般而言,权限元素应包括一个对资源的权限声明,或者是对提供这一信息的 服务的参照。权限一般包括知识产权(IPR)、版权或其它各种各样的产权。如果没有权限元 素的标注,不可以对与资源相关的上述或其他权利的情况做出任何假定。 元素名称来源(source)定义对当前资源来源的参照。注释当前资源可能部分或全部源自来源元素所标识的资源,建议对这一资源的标识采用一个符合规范标识系统的字串或数字组合。元素名称主题(subject)定义资源内容的主题描述。注释如果要描述特定资源的某一主题, 一般采用关键词、关键词短语或分类号,最 好从受控词表或规范的分类体系中取值。元素名称题名(title)定义赋予资源的名称。注释 一般而言,指资源对象正式公开的名称。 元素名称类型(type) 定义资源内容的特征或类型。注释资源类型包括描述资源内容的一般范畴、功能、种属或聚类层次的术语。建议 采用来自于受控词表中的值(例本文档来自技高网
...

【技术保护点】
一种适用于网络学术资源永久存档及使用的元数据方案,该方案具有如下特点: (1)基于都柏林核心元数据集扩展出8个元素; (2)特别适用于揭示、存档和检索网络学术资源。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘玉良
申请(专利权)人:北京中加国道科技有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1