网络信息资源的组织原则研究--对DC元数据的探讨

时间:2020-08-13 08:49:55 MBA毕业论文 我要投稿

网络信息资源的组织原则研究--对DC元数据的探讨

引言
  
  现在人们已经进入网络时代,人们查询信息的手段越来越趋向于网络化,然而网络信息的提供者只注重信息的内容,而忽视了网络信息资源的描述问题。这使得搜索引擎无法提取网络信息资源的核心内容,从而导致查全率和查准率低。一种现象随之产生,即在互联网上总能找到(甚至只能找到)不需要的东西。网络信息资源被准确而合理的描述是其被有效利用的前提和基础,尤其对庞大的网上资源而言。因此,只有对网上的信息资源进行整体上的有效组织、管理和个体上的充分揭示和描述,才能从根本上解决查找、利用上的困难,提高查全率和查准率。但是,网上的信息资源不同于传统的文献资源的各种特点,要求创立有别于传统书目著录组织方式的新工具——元数据,就在这一背景下产生了。
  元数据,即关于数据的数据,用来描述网络信息资源、加强对网上信息资源的组织和利用的网络数据集合。而都柏林核心元数据集(Dublin Core Element Set,简称DC)是其中发展比较成熟而又比较成功的一种元数据。DC 元数据计划的创建,是通过网络信息资源的提供者对资源属性信息的描述,并对其内容进行编目、定位,来帮助人们尽快地在网上发现所需要的有效信息资源。因此,DC 元数据资源描述方案又称为网上资源的编目。
  
  1 DC 元数据的发展和规范
  
  1995 年3 月由OCLC ( Online Computer Library Center)和NCSC(National Center for SuperComputing Application)在美国俄亥俄州的都柏林镇联合召开了第一届DC 元数据研讨会,目的是寻求一套见解有弹性、非专业图书馆人员也可轻易掌握和使用的信息资源著录格式,以提高网络信息资源的开发利用率。会议结果产生了13 个元数据项,因为开会地点在柏林,因此成为柏林核心集,简称DC。1995 年至今,OCLC 与各有关机构联合举行了8 次DC 研讨会,每一次研讨会都推出一些具体的研究成果,1996 年9 月24 日~25 日,第三届元数据研讨会将原有的13 个元数据项扩充为15 个,1999 年12 月22 日,经过第七次会议讨论,形成了DC 修饰词1.0 工作方案,经过几年的研究探讨,DC 被译成25 种语言,并被许多国家纳入国家标准中,成为描述电子信息的一个部分。因此DC 的影响正逐步扩大,有望在不久的将来成为各国都能接受的国际标准[1]。
  DC 是在网络环境中描述文件类对象所需要的最小元素集。其中15 个元数据项可以分为[2]:
  (1)Title:标题项,由资源作者或出版者给出的被描述资源的名称。
  (2)Subject:主题词或关键词项,一般是描述资源的主题和内容的关键词或短语。
  (3)Description:描述项,资源的文本描述,包括文献类对象的文摘或视频的内容描述。
  (4)Source:来源项,用来唯一标识被描述资源的来源。若当前的资源为其原始形式,来源项元素可以不用。
  (5)Language:语言项,被描述资源内容的描述语言。
  (6)Relation:关联项,被描述资源与其他资源之间的关系。
  (7)Coverage:时空范围项,被描述资源空间或时间特性。空间范围物理区域,来自规范词表的地名或全称。时间范围指资源内容,而不是资源产生的时间(由日期Date 元素表示)。时间描述采用与日期Date 相同的格式或者采用规范列表中的时间范围描述。
  (8)Creator:作者或者创建者项,对创造资源知识内容负主要责任的个人或机构。
  (9)Publisher:出版者项,负责发行被描述资源的组织。
  (10)Contributor:其他参与者项,指没有在Creator 元素中列出的对被描述资源的.创作做出了共献的其他人或组织,其贡献次于创建者。
  (11)Rights:版权管理项,被描述资源的版权声明和使用范围。
  (12) Date:发布日期项,被描述资源公开发布的日期。