论地方文献报刊信息数据库及主题标引工作

时间:2020-08-28 17:01:15 计算机毕业论文 我要投稿

论地方文献报刊信息数据库及主题标引工作


1 地方文献报刊信息数据库

地方文献是指内容上具有地域性,同时具有重复使用价值的文献。由于它完整、系统地记录了特定地域内自然和人文方面的各种信息,从而为人们提供了研究特定地域内历史、现代及未来的有关资料。

地方文献的类型多种多样,报刊文献是其中的一种。它具有信息量大,传递周期短,内容相对客观、翔实等特点。但由于它的总量太大,有关的地方文献信息分散在不同时期、不同品种的报刊之中。仅靠浏览原始文献,迅速查到有关资料,几乎是不可能的。地方文献报刊索引就是为解决这一问题而编制成的一种检索工具。

在手工时代,地方文献报刊索引表现为篇目索引或题录索引的形式,即将报刊中所载地方文献篇目按一定顺序编排起来,以利读者查找文章的所在位置。这种索引不反映文章的具体内容,只具有指向和示址作用。同时,也对地方事物起着揭示和报道的作用。除了作为一种综合性的检索工具外,还可以在这种索引的基础上编制各种情报报导刊物,或围绕特定学科及专业进行定向报导和检索,以服务于地方的各项事业。

鉴于地方文献报刊索引的重要作用,许多公共图书馆都曾积极编制这种索引。例如,首都图书馆自50年代起开始编制《北京地方文献报刊资料索引》,涵盖了本世纪以来的内容;甘肃省图书馆也是在同一时期开始编制西北五省的地方文献报刊索引;长春市图书馆也曾编制了《东北地方文献索引》等检索工具。为了避免目录体系过于庞大,这种卡片式篇目索引一般仅以分类方式编排。因此读者也只能从分类途径对报刊上的地方文献信息进行检索。 进入计算机时代以来,以数据库形式来处理地方文献信息已成为图书馆地方文献工作的必然趋势。计算机所具有的自动识别与排序功能,使地方文献信息的编排检索变得更加方便、更加快捷。通过全文扫描技术完成的报刊全文数据库,使得报刊上的地方文献信息得到更充分地揭示和利用。由于计算机具有一次性输入,多途径输出的功能,因而在对地方文献信息进行存储与检索时,增加了篇名、著者、出版、文摘等多方面的途径。尤其是从主题途径检索地方文献信息的问题得到了很好地解决。

在地方文献报刊信息数据库(以下简称报刊信息库)中,分类标引和主题标引都是以揭示文献内在特征为目的的标引方法,只是揭示的角度有所不同。由于地方文献的史料特征极为明显,故地方文献的读者往往是从特定的事件、人物、时间、地域的角度入手进行检索。因而可以说主题检索是一种最直接反映地方文献内容特征的检索途径,也是建立检索工具和检索系统的'基础和前提。近些年来,图书情报界对有关主题标引的原则和操作方法有过许多研究和探讨,撰写过很多的著作和文章。但由于地方文献中连续出版物本身所具有的特征,其主题标引的原则和方法与其它类型文献的标引还是有所不同。本文拟从报刊信息数据库的建设入手,探讨有关地方文献报刊信息主题标引的一些问题。

2 地方文献报刊信息数据库中的主题标引

2.1词表的编制

报刊信息库与其它类型数据库相比,最突出的特点是要反映地方文献本身所具有的特征。同时还要满足地方文献用户特殊的检索需求。因此,选择一部适合地方文献特征的主题词表是开展标引工作的首要问题。

《汉语主题词表》(以下简称汉表)是一部供机检使用的综合性基础型词表。它所收录的词汇可以供各个机构和行业从中选词,以编制适合本专业或本机构使用的专业词表。实际上,我国很多专业情报机构和图书馆都是在参考这部国家词表的基础上编制自己词表的。在编表过程中,抽取主题词时当尽可能不破坏原有词表的词间关系。但必要时,词间关系及基本范畴还是需要重新确定的。

由于地方文献是对某一地域自然和人文现象的客观描述,它所表现出的地域性和专指性极强。用综合性的《汉表》来标引各地的地方文献,则将有相当部分的文献不能被准确地表达其主题概念;其次,地方文献的内容范畴与《汉表》中的基本范畴也有所不同。《汉表》是以学科体系作为划分范畴的基本依据;而地方文献则是以特定地方的自然环境、人文环境和地方事业作为划分范畴的基本依据。所以地方文献主题词表需要在《汉语主题词表》的基础上自行编制。