浅谈数据集市技术在高校信息管理中的应用

时间:2020-10-04 09:58:31 机电毕业论文 我要投稿

浅谈数据集市技术在高校信息管理中的应用

  论文关键词:数据仓库:数据集市;AnlaysisServices(分析服务工具);OLd(联机分析处理)

  论文摘要:高校各类信息系统积累了大量的数据,亟待一种方法对其进行整合以更大限度的发挥其作用,文章针对高校特点提出了自底向上先建立数据集市,再集成为数据仓库的解决方案,并针对西华师范大学学院利用SQLcSver2000建立了数据集市。

  1引言

    计算机技术已经在高校教学管理工作中广泛应用,各种类型的信息管理系统在高校各部门都已建立,如学生管理系统、教务管理系统、教师信息系统等等,它们的开发和应用大大提高了工作效率。但是,各类信息资源分散在各个不同的部门,缺乏统一的管理和组织,虽然积累了大量的数据信息,可是功能只是局限于查询等初级的应用,不能实现一些高级应用如:OLAP分析、数据挖掘等。对这些数据信息,巫待一种方法对其进行整合以更大限度的发挥其作用,这种方法就是建立数据仓库。

    自顶向下开发数据仓库能最大限度地减少集成问题,是很好的开发方案。然而,数据仓库项目庞大、结构复杂、物力投人大、开发周期长,并且很难使整个组织的共同数据模型达到一致,从而缺乏灵活性。所以,高校数据仓库的建设应该采取渐进式、分阶段、分步骤的策略一自底向上首先设计、开发独立的面向一个院、系、部门数据集市,待成功后再建立所有院、系、部门的数据集市,最后集成为数据仓库。这种方式灵活性大、花费又低,并且能快速见效,更适合高校的实际情况。

  2数据仓库的建立

  对高校数据仓库建立我们设计如下实现步骤(图1):

    (1)定义一个高层次的整体数据模型,在不同的主题和可能的应用之间,提供全局范围的、一致的、集成的数据视图。无论数据集市提供何种功能,都是数据仓库的组件,要保证数据的组织、格式和架构在整个数据仓库内保持一致。表的设计、更新机制或维度的层次结构如果不一致,可能会使数据无法在整个数据仓库内重新使用,并可能导致由相同的数据生成不一致的报表。

    (2)基于上述相同的整体数据模型,并行地实现独立的院、系、部门数据集市和校级部门数据集市。

    (3)构造分布式数据集市,通过网络中心服务器集成不同的数据集市。

    (4)集成为一个多层数据仓库,这里,多层数据仓库是所有仓库数据的唯一管理者,数据则分布在一些依赖的各院、系、部门数据集市中。

    (5)建立C/S模式通过网络中心服务器为广大的教学管理人员、教师、学生提供服务。开发OLAP分析和数据挖掘等高级的应用,为高校教学管理提供决策支持。

3数据集市实例设计

    本文以西华师范大学计算机学院为研究对象,利用SQL Server 2000及Analysis Services构造了一个面向院、系、部门的数据集市。

  3.1数据集市模型的设计

    在决策分析时,需要从多个方面来分析一个主题,这就要求数据集市以多维数据集的方式来组织数据,以简化OLAP分析,提高查询性能。本文采用了雪花模型一将星型模型的维表进行分解,分解成多个具有层次关系的维表,建立多维数据集。分解维表的过程也就是对维表进一步标准化的过程。雪花模型是标准化的维表,粒度较低,增加了应用程序的灵活性,易于实现动态SQL生成,便于以后进行数据挖掘等高级应用(图2)。