数字时代情报学发展展望笔谈--在数字环境下实现知识的组织和

时间:2020-09-15 18:54:58 文化毕业论文 我要投稿

数字时代情报学发展展望(笔谈)--在数字环境下实现知识的组织和

国学大师陈寅恪说过,一时代之学术,必有其新材料与新问题。取用此材料,以研求问题,则为此时代学术之新潮流。情报学是20世纪40年代为克服现代科学技术发展带来的情报危机而产生的新兴学科,其目的是将知识信息组织有序化,为用户提供服务。信息技术的高度发展和广泛应用为情报学带来了新的发展机遇,同时也为研究者提出了许多新的课题。21世纪是信息和网络的世纪,这种变革的背景构造出当代情报学发展的新语境,一系列新思想、新方法、新技术应运而生。在新的语境中探讨情报学的新问题,对促进情报学的学科发展具有特别重要的意义。

      一、情报学的初衷:知识的有序组织

    情报学研究的对象是知识的组织、表达、检索、利用、交流的过程及规律,其根本任务是组织知识信息并提供有效利用。这一思想在情报学创立之初就已经被明确提出。布什于1945年7月在《太平洋月刊》上发表的《诚若所思》一文,被视为是情报学作为独立学科诞生的标志性文献。布什理论的核心是关于知识记录、存储和利用的问题,而技术只是其用来解决这些问题的手段。
    继布什之后,另一位著名的情报学家布鲁克斯明确地将“知识”的概念引入到情报学领域,并提出了布鲁克斯基本方程式以及“认识地图”。他所描绘的“认识地图”,是对文献内容进行知识分析与组织,找到人们在知识创造过程中相互影响及联系的结点,从而深入揭示知识的有机结构,为用户提供纯情报。可以说,情报学在产生和发展初期就已经将知识作为学科理论体系的逻辑起点,所要解决的是如何有效组织并利用知识的问题。但遗憾的是,这一思想没有得到贯彻,甚至在很长一段时间被人们所淡忘。究其原因,一方面是知识的描述、揭示、表达和组织十分困难,人们对知识的认识水平还比较粗浅,不能准确地描述和表达知识;另一方面则是当时的技术手段也不能支持知识的揭示与组织,从而使得“认识地图”的描述和绘制困难重重,仅仅停留在理论构想的层面上。
    这种理念超前于技术的结果,导致了情报学与图书馆学,情报学与文献学界限的不分明。在对知识单元的深度分析组织无计可施的情况下,情报学的研究只能退却到文献层次上。目录、标引、分类法、主题词表等手段在文献信息的序化组织方面是一个进步,但都只是对文献外部特征或内部信息特征的描述和表征,并没有涉及到深层次的知识单元。而这些研究和工作是图书馆学和文献学都能够解决的,既然如此,情报学的`立足点究竟在哪里?与其他学科相比,情报学自身的独立性和特征是什么?许多人对于情报学存在的必要性产生了质疑,情报学由此遭遇到了前所未有的困境。面对情报学进展缓慢的状况,笔者曾提出,情报学要想取得突破,在微观上需要解决两个关键问题:一是知识信息的表达和组织必须从物理层次的文献单元向认识层次的知识单元或情报单元转换;二是知识信息的计量必须从语法层次向语义和语用层次发展。
    研究知识的组织和利用,解决信息爆炸与人们利用知识信息之间的矛盾,这在情报学创建之初,被确定为学科的基本任务和目标。值得欣慰的是,信息技术的进步为情报学的发展带来了契机。这些技术手段突破了情报处理长期停留在文献层次的局限,使得情报学可以从不同的角度、不同的侧面和不同的节点对数字化全文信息进行描述和整合,从而揭示、生成和组织知识。

      二、数字时代:对知识组织问题的深入探讨

    知识是人类在历史发展中的宝贵财富,它来源于社会实践所获得的感性认识,以及人们对客观世界认识的积累。经过资料的记载和总结,知识在人类发展中得以传承和升华。随着网络社会和知识经济的兴起,人们逐渐意识到知识作为生产要素,在社会发展中的重要作用。对于知识的认知和了解,一直是人们追求的目标。知识的组织、表达、挖掘、发现和共享成为网络时代的一个重要命题。
    知识可以分为显性知识和隐性知识,或者是“可编撰的”知识和“意会的”知识。前者能够用语言和图形进行表示和处理,后者大多隐藏在人们的大脑中,或是没有经过编码处理,通常处于一种潜在的状态。对于显性知识的组织,我们已经拥有一系列的技术和方法,如分类法、主题词表等;而隐性知识这块领域,我们还鲜有涉足。但我们也看到,对于显性知识,我们所取得的相对成熟的成果也主要集中在语法层面,如图书馆的文献组织,更大程度上是一种知识载体的直观陈列。近年来,数据库技术日益成熟,能够进行海量信息的处理,从而使知识组织由文献层次上升到信息层次,从语法处理转变为语义处理。
    知识组织有两个层次,一是对知识单元本身进行描述和标引,二是揭示知识节点之间的逻辑联系。现在的一些新兴技术已经可以对知识单元的特征进行标引,目前的难点在于从知识单元内容的描述进而延伸到对于其逻辑关系的揭示。
    近年,美国芝加哥大学的Don R.Swanson教授的研究备受瞩目。他的突出贡献在于创立了基于非相关文献的知识发现方法,并因此在2000年被美国情报科学与技术学会(ASIST)授予了该学会的最高成就奖。而事实上,文献间隐性关联的发现往往要比显性关联的识别更有意义。通过深入的研究,Swanson在已发表的医学领域的非相关文献中推理得出了原先未被发现的知识,并在此基础上设计出了Arrowsmith软件系统,专门用于搜索非相关文献中的潜在联系。这种基于文献的知识发现方法,最大的突破点就在于:对文献中知识单元的相关关系进行了揭示和重组,并由此产生了新的知识。
    Swanson创立了新的情报学研究方法,同时也用试验的事实验证了情报学的相关性原理。同一等级、不同等级的知识单元之间都存在着内在的逻辑关系,相关性正是揭示出了这种逻辑关联的属性。传统的情报标引和检索语言都是基于信息的相关性采用概念逻辑划分来组织和存贮文献信息,而在深层次的知识组织中,相关性也是重要的基本原理。单个的知识单元只是以独立的个体存在,只有利用关系链接才能从微观层次表达概念之间的关联。但是,Arrowsmith所查找的仅仅只是文献标题中的关联,并没有在真正意义上实现知识单元相关性的查询。从这个意义上说,后来所提出的基于数据库的知识发现(KDD,Knowledge Discovery in Database)无疑是一个进步。KDD发源于人工智能领域,能够处理海量且来源广泛的数据源,并能进行深层数据挖掘,完成知识的提取、过滤、转化、集成。

共2页: 1

数字时代情报学发展展望(笔谈)--在数字环境下实现知识的组织和

论文出处(作者):