聚集学术机构知识的中心:机构库(Institutional Reposi

时间:2020-09-16 13:59:13 文化毕业论文 我要投稿

聚集学术机构知识的中心:机构库(Institutional Repository)探析

  1 引言
    早在1988年,Peter Drucker就在《即将到来的新组织》一书中预言,“对一个组织来说,最重要的是该组织所拥有的知识资源,对其加以有效管理是组织成功的最关键因素。”[1]学术机构是人才和知识的集中地,收集、管理、利用其成员在学术科研等多方面的高质量数字信息资源,对增强机构实力、赢取竞争优势等都具有重要意义。时至今日,各学术机构成员可在互联网上以各种方式发表、传播和交流学术信息,这给组织、管理这部分信息带来了相当大的困难的同时,传统出版模式的局限性也日趋明显,不利于学术交流的开展。有鉴于此,2001年,俄亥俄州立大学的高级行政官员和该馆馆长布兰宁(Joseph J.Branin)在探讨开开发远程教育体系时,提出并着手建立俄亥俄州立大学知识库(Ohio State University Knowledge Bank),以保存该校师生员工的数字知识资源,这也成为机构库(Institutional Repository,以下简称IR)最初的雏形。2002年,麻省理工大学(Massachusetts Institute of Technology,MIT)和惠普公司(Hewlett-Packard Corporation)合作推出DSpace,宣告IR的正式诞生。同年,在“第六届欧洲数字图书馆先进技术研讨会”上,MacKenzie Smith做了《DSpace:来自MIT图书馆和惠普实验室的机构库》的学术报告,详细介绍了DSpace的构建原理、运行情况及在开放学术交流和数字资源长期保存中的重要作用[2],这一报告引起了各国学者的关注,也促成了世界范围内关于IR的大规模理论与实践研究。

      2 机构库的定义

    关于IR,目前尚无统一的定义,比较有代表性的两种观点是:
    (1)美国网络信息联盟(Coalition for Networked Information)的常务董事Clifford Lynch认为,IR是指大学为方便其共同体组织、整理、存储和利用师生员工相关的数字知识资源而提供的一系列服务[3]。此定义强调IR的目的是为用户提供一系列服务,但服务对象局限于IR所属的机构成员,服务的目的是协助大学共同体组织、利用其师生员工的数字知识资源。
    (2)加拿大研究图书馆协会(Canadian Association of Research Libraries,CARL)则提出,所谓IR就是指搜集、存储学术机构成员的知识资源,并提供检索的数字知识库,同时认为IR可以作为一个全球知识库的子库,为世界范围内的网络用户服务[4]。此定义认为IR是一个聚集数字信息资源的知识库,其资源对任何国家的所有网络用户开放,但该定义遗漏了一个重要的内容,即IR中的绝大部分资源可免费获取。
    据此,笔者认为:所谓IR,就是以搜集、组织、存储学术机构(大学、大学共同体等)相关数字知识资源为主要任务,并将其中绝大部分资源对任何网络用户免费开放的知识库。

      3 机构库产生的原因及其主要特点

    2.1 机构库产生的原因
    IR之所以在人类刚跨进21世纪的时候兴起,原因是多方面的,但最为根本的原因在于:
    (1)网络给信息组织带来的困难。网络环境下,学术机构成员可以通过各种方式(如个人网站、blog等)在互联网上发表、传递各种学术信息资源,据MIT的统计数据表示,43%的学者会把预印本(preprint)上载到个人网站上,60%的人则通过e-mail传递预印本文献[5]。发表、传递方式的多样性虽然在一定程度上促进了学术交流,但由于这些方式的随意性太强,使得搜集、组织、存储、利用某一学术机构的知识资源就相当困难,给相关机构造成难以估量的损失。这也是建立IR最根本的原因。
    (2)传统的期刊出版模式带来了学术交流障碍。近年来,随着出版机构的兼并和商业化,期刊价格大幅度攀升,大大超过了图书馆经费所能承受的范围。美国研究图书馆协会(Association of Research Libraries,ARL)的统计表明,在1986-2000年之间,科学、技术和医学方面的学术期刊价格增长了226%,同期商品零售价格指数增长幅度为57%,在此期间,图书馆购买期刊的经费增长了192%,但购买的期刊品种却下降了7%[6]。虽然图书馆也尝试通过馆际互借、加大数据库的购买力度、远程文献传递等措施来缓解经费短缺的压力,但效果并不理想,也没有从根本上解决学术交流的问题,从而促使人们思考传统的期刊出版模式之不足,并探讨新的方式以促进学术交流。
    (3)网格技术和开放源代码的推动。网格计算源于元计算(Metacomputing),其初衷是将分布的多台超级计算机连接成为一个可远程控制和访问的元计算系统,网格体系根据高速和共享两大特征,正在不断向基于更大的网、共享更多的资源、构建更大的计算能力的目标迈进。网格技术将有助于解决大并发量访问、海量信息检索以及资源共享等方面的技术问题。而开放源代码的意义则在于将人类大量宝贵的创造力从“重复创造”中解放出来。近年来,开放源代码在数字图书馆领域的应用已经相当普遍。美国的OCLC,英国的UKOLN,以及新西兰的DL项目都是图情领域推动开放源代码应用的代表[7]。网格技术和开放源代码为IR的建立奠定了关键的技术基础,使IR思想的实现和快速发展成为可能。
    3.2 机构库的特点
    (1)综合性。IR不仅包括常见的研究性学术资源,如期刊论文、电子预印文本、技术报告、会议论文、学位论文、数据库及数字图书馆资源,还包括部分学术数据库所不收录但又具有较高价值的资源,如工作文件、图像、音频和视频文件、学习资料等[8]。这样IR即可全面系统地反映所属学术机构的教学和科研成果,不仅有利于分析自身教学、科研的优势与不足,衡量现有的研究水平和明确今后的发展方向,还可作为对外展示其综合实力的窗口,以提高该学术机构的知名度和影响力。
    (2)开放性。进入新世纪以后,实现学术资源、科研成果的开放共享已经成为国际潮流。IR以其开放性的特点成为开放共享运动中的弄潮儿,IR对世界范围内的所有用户不抱任何偏见,任何用户随时都可以通过互联网不受限制地合理利用其中的知识资源,这既利于本领域学者之间的学术交流,也利于其他学科研究者跨学科获取知识与信息,更重要的是它打破了国家界限,特别是有助于发展中国家的科学研究者追踪世界著名学府研究的最新发展,从一定程度上缩小发展中国家与发达国家之间的知识鸿沟。
    (3)动态性。一般来说,信息一旦输入数据库就不再发生变化,IR则不同,为了使最新研究成果能在最短的时间内发布,提交者可根据自己的最新研究随时修改、更新之前提交给IR的信息,使IR体现出明显的动态性特点。这一特点虽然可以加快学术交流的速度,但也有可能使IR中的内容更迭过于频繁,对其稳定性产生负面影响。

  4 国内外相关项目简介

    近两年来,随着各学术机构对IR的日益重视,IR的建设也取得了初步成效,现选取其中具有代表性的3个项目介绍如下:
    4.1 DSpace
    2000年3月,惠普公司出资1800万美元,与MIT图书馆合作开发DSpace,2002年11月,DSpace正式面世并迅速成为一个由剑桥大学、哥伦比亚大学等七家著名学府直接参与的联合机构库。DSpace是目前全球最有影响力的机构库,其收录的信息资源主要包括研究报告、数据库、音频和视频文件以及其他格式的MIT认为确实重要的文件,但不收录MIT学生的研究资料、机构记录以及非MIT教师的研究成果等。DSpace提供一系列遵循开放档案信息系统参考模式(Reference Model for an Open Archival Information System)的上载、管理、传播数字信息的工具,并使用DC、OpenURL与OAI-PHM等一系列开放标准,因而成为其他机构开发IR的首选软件,据统计,在成立后不到一年就已经有3500家来自全球的机构下载了DSpace的开放源代码[9]。因此可以说DSpace是一个搜集、管理、标引、传播数字信息的系统、工具和平台。
    DSpace的垂直体系结构包括三级层次:存储层、事务逻辑层和应用层,每一层都内嵌API(Application Programming Interface),方便系统的升级,同时也使其他大学在开发IR时能根据实际情况调整相关部分,提高DSpace的灵活性。存储层的主要功能是存储数字化信息,事务逻辑层是整个系统的核心部分,主要包括工作流管理模块、内容管理模块、检索和浏览模块,这些子模块也都相应地嵌有API;应用层则主要作为用户检索信息的界面[10-11]。
    4.2 CARL机构库导航项目
    CARL机构库导航项目(The CARL Institutional Repositories Pilot Project)由加拿大12所大学于2002年发起建设,目前主要由西蒙·弗雷泽大学、多伦多大学等5所大学图书馆负责操作管理,导航项目旨在通过联合加拿大众多学术机构的知识库,提高加拿大学术机构及研究人员的曝光度和影响力,同时,通过实践操作为加拿大其他机构开发IR提供经验。2004年,西蒙·弗雷泽大学推出名为“CARL收割机”(The CARL Harvester)的搜索引擎,作为导航项目检索服务的操作界面,通过此界面任何国家的用户都可以免费检索其中的资源。目前该搜索引擎已经收录了来自马尼托巴大学等9个IR的4493条记录并保持每日更新,提供简单检索、高级检索和分类浏览等3项检索功能,用户可按任意词、作者、题名、摘要、索引号、日期、语种等多种途径查找所需信息[12-13)。
    4.3 学术信息库
    为推进香港中文大学(The Chinese University of Hong Kong,CUHK)印刷文献的数字化进程,加强图书馆的电子导航功能,CUHK图书馆于2004年夏天开始建设学术信息库(Scholarly Information Repository,SIR),SIR以尽可能多地收录CUHK共同体成员出版物信息为目标,收录的文献种类包括学校出版物、各院系及教师出版物、教师工作文档、期刊论文、报纸、书籍、书籍篇章、学位论文、会议论文、技术报告以及专利信息,除提供引文和简单著录信息之外,还尽可能地提供全文的链接。
    提交者通过SIR系统中的“引文输入系统”输入出版物的详细信息,这部分信息在传递给SIR系统的同时,还会传送给研究与科技管理局中的在线出版输入系统,SIR的检索界面则允许用户浏览和检索所需信息,并在结果中提供图书馆所购买的电子资源、互联网上免费和有偿电子资源的链接[14]。

共2页: 1

聚集学术机构知识的中心:机构库(Institutional Repository)探析

论文出处(作者):