大数据环境下情报学发展的思考

时间:2020-10-12 19:31:42 网络工程毕业论文 我要投稿

大数据环境下关于情报学发展的思考

  摘要:文章从情报学学科体系的角度出发,从理论情报学、应用情报学、技术情报学、管理情报学四个方面展开思考,分析了大数据环境下情报学的发展趋势。

  关键词:大数据时代 ;情报学;学科发展 ;大数据

  大数据趋势产生的深层原因是海量数据的存在和越来越多的事物是以数据形式存在的。随着计算机技术全面融入社会生活,我们的工作、生活,甚至国家经济的发展都受到了大数据的影响,现在人们已经意识到了大数据的重要性。在大数据时代因素的推动下,情报学的理论研究、研究方法以及情报学技术等都将做出新的改变,趋势预测性情报的分量将继续加重,情报产生中的跨界合作将增强,但现在我们对大数据环境下情报学的发展研究还远远不够。

  一、大数据的内涵及基本特征

  1.1 大数据的内涵

  按照维基百科的定义:大数据是指所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息集合。研究机构Gartner的定义:大数据是指需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。麦肯锡的定义:大数据是指无法在一定时间内用传统数据库软件工具对其内容进行采集、存储、管理和分析的数据集合。

  现在越来越多的领域开始关注和研究大数据,这是因为大数据涉及不同的学科领域,人们从不同的角度、不同的科学领域出发,对大数据的定义进行了诠释。到目前为止,大数据尚未形成统一明确的定义。笔者认为,大数据的“大”不单单是指数据的量很大,还指数据无时无刻不在急剧增长,数据的形式纷繁多样,另外,数据的覆盖面很广泛,数据之间交互频繁,数据之间相关关系复杂,这些都是大数据“大”的表现。

  1.2 大数据的基本特征

  业界有人将大数据的特征归纳为“4V”,即数据种类繁多(Variety),数据体量巨大(Volume),数据生成和处理速度快或理解为流动速度快(Velocity),至于第四个“V”,有人的理解是价值密度低或者理解为数据的价值日益突现(Value),也有人认为大数据具有真实性(Veracity)的特征。笔者更赞同的是Volume、Velocity、Variety、Value四个特征。虽然业界也有很多人赞同上述四个特征,但是对大数据特征含义的理解却不尽相同。笔者认为,大数据具有以下特征。

  1.2.1 数据的体量巨大。据麦肯锡全球研究院(MGI)估计,2010年,企业的磁盘中存储了超过7EB字节的新数据;用户在个人PC机和笔记本等设备上的新数据存储量也超过了6EB字节。2011年全球的数据量达到18Z。体量巨大是大数据的首要特征。

  1.2.2 数据生成速度快,并且数据实时变化迅速。在这个信息化的时代,数据时刻在产生,比如银行交易、淘宝购物、购买车票、打电话、检索资料等,这些行为都可以以数据的形式呈现,而且数据呈指数级增长。此外,数据是实时变化的,人们对数据的处理速度也提出了更高的要求。

  1.2.3 数据种类的多样性。现在大数据涉及的领域非常广泛,数据的种类也趋于多样化,数据会以数据文本、数据库、图片、动画、音频、视频,甚至是以日志文件、网页、电子邮件等多种形式呈现在人们的面前。随着信息技术的不断发展,新的数据来源和数据形式也在不断地出现。

  1.2.4 数据本身的价值密度低。大数据时代,各种数据的生产速度非常快,研究员要在冗余的信息中发现其价值并不容易。

  二、大数据时代情报学发展所面临的机遇与挑战

  2.1 大数据时代情报学发展所面临的机遇

  2.1.1 为情报学研究提供丰富的数据资源支持。情报学中的很多研究方法都是建立在大量数据的基础之上,在这个网络化和信息化的时代,人们时时刻刻都在以各种各样的方式生产着不同类型的数据,如前文提到的图片、动画、音频、视频、日志文件、网页、电子邮件。大数据时代的到来为情报学的研究提供了丰富的数据资源。

  2.1.2 完善情报学学科技术。大数据时代将继续催生很多新型的产业,基于大数据的数据信息收集、存储、处理、分析、挖掘技术都是这个时代的产物,例如云计算、移动互联网、物联网、文本挖掘、意见挖掘、中文分词和NLP自然语言处理、神经网络算法、网络分析SNA、数据可视化等。这些技术也为情报学的学科技术研究打下了基础,甚至很多技术都可以直接被用到情报学研究中,如云存储技术、云计算技术等,在大数据时代,这些计算机互联网技术都可以为情报学研究所用,它们很好地完善了情报学学科技术。

  2.1.3 大数据将助力情报学新的'研究范式和方法论。在大数据时代,人们所面临的数据不仅仅体量巨大、类型多样化,而且它们还在以惊人的速度生长并发生着实时的变化,这些都对情报学的研究方法提出了新的要求,因此对情报学研究方法而言,唯有创新才有出路。以前,人们通过研究获得准确的情报并供人们使用,而在大数据时代,情报学将在研究方法上做出改变:情报学的研究方法可以转向研究数据之间的相关性,并根据数据之间的相关性得出预测性情报,以供人们决策使用。

  2.1.4 扩展情报学的学科研究和应用领域。大数据时代,在多种因素的影响下,情报学的研究内容和范围不断扩展。在这个信息化的时代,情报学的发展离不开信息技术和网络技术的支持,情报的获取、存储和处理都会涉及与其他学科的交叉合作。比如,在大数据时代,人们的隐私急需得到保护,因此,信息政策和法律法规必将是社会科学研究的一个重要方向,这也将是情报学与其他学科跨界合作的新领域。

  2.2 大数据时代情报学发展所面临的挑战

  2.2.1 价值密度低,获取有效信息难度加大。数据信息是情报学研究的重要基础,但在大数据时代,一方面数据的体量巨大,要想从中获取对所研究主题有用的数据信息不是一件易事;另一方面数据的种类多样,不仅包括部分结构化数据,还包括图片、音频、视频等多种形式的非结构化数据。此外,在大数据时代,数据信息是实时变化的,这些都加大了情报工作人员获取有效信息的难度,这是情报学发展中应该重视的一点。

  2.2.2 情报学学科研究技术有待进一步开发。在这个信息技术高速发展的时代,情报学技术的发展形势不容乐观。由于情报学知识结构的限制,情报学很难培育自己的情报网络技术,情报学很多技术都是采用拿来主义,把其他领域的技术直接运用到自己的学科研究中,但是在大数据时代,为了保证大数据的价值,必须对数据进行快速有效的处理,而我们现有的情报采集、分析、挖掘、处理等技术已经不再适应现在巨量、多样化、实时变化的大数据环境。