数据管理技术的产生与发展
数据管理技术的发展大体可以归为3个阶段:人工管理、文件系统和数据库系统阶段。
1.人工管理阶段
在20世纪50年代中期以前,计算机主要用于科学计算。外部存储器只有磁带、卡片和纸带等,还没有磁盘等直接存取的存储设备。软件只有汇编语言,尚无数据管理方面的软件。数据处理方式基本是批处理。这个阶段有如下几个特点:
(1)计算机系统不提供对用户数据的管理功能。用户编制程序时,必须全面考虑好相关的数据,包括数据的定义、存储结构以及存取方法等。程序和数据是一个不可分割的整体。数据脱离了程序就无任何存在的价值,数据无独立性。
(2)数据不能共享。不同的程序均有各自的数据,这些数据对不同的程序通常是不相同的,不可共享;即使不同的程序使用了相同的一组数据,这些数据也不能共享程序仍然需要各自加入这组数据,谁也不能省略。基于这种数据的不可共享性,必然导致程序与程序之间存在大量的重复数据,浪费了存储空间。
(3)不单独保存数据。由于数据与程序是一个整体,数据只为本程序所使用,数据只有与相应的程序一起保存 才有价值,否则就毫无用处。所以,所有程序的数据均不单独保存。
2.文件系统阶段
到了20世纪50年代后期至60年代中期,计算机不仅用于科学计算,还用于信息管理方面。随着数据量的增加,数据的存储检索和维护问题成为紧迫的需要,数据结构和数据管理技术迅速发展起来。此时,外部存储器已有磁盘、磁鼓等直接存取的存储设备。软件领域出现了操作系统和高级语言。操作系统中的文件系统是专门管理外存的数据管理软件,文件是操作系统管理的重要资源之一。数据处理方式有批处理,也有联机实时处理。这个阶段有如下几个特点:
(1)数据以“文件"形式保存在外部存储器的磁盘上。由于计算机的应用转向信息管理,因此对文件要进行大量的查询、修改和插入等操作。
(2)数据的逻辑结构与物理结构有了区别,但比较简单。程序与数据之间具有“设备独立性”,即程序只需用文件名就可与数据打交道,不必关心数据的物理位置。由操作系统的文件系统提供存取方法(读/写)。
(3)文件组织多样化。有索引文件链接文件和直接存取文件等,但文件之间相互独立、缺乏联系。数据之间的联系要通过程序去构造。
(4)数据不再属于某个特定的程序,可以重复使用,即数据面向应用。但是文件结构的设计仍然是基于特定的用途,程序基于特定的物理结构和存取方法,因此程序与数据结构之间的依赖关系并未根本改变。
(5)对数据的操作以记录为单位。这是由于文件中只存储数据,不存储文件记录的结构描述信息。文件的建立、存取查询、插人、删除、修改等所有操作,都要用程序来实现。
随着数据管理规模的扩大,数据量急剧增加,文件系统显露出如下一些缺陷:
(1)数据冗余。由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。
(2)不一致性。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使相同的数据在不同的文件中不相同。
(3)数据联系弱。这是由文件之间相互独立,缺乏联系造成的。
文件系统阶段是数据管理技术发展中的一个重要阶段。在这一阶段中,得到充分发展的数据结构和算法丰富了计算机科学,为数据管理技术的进步发展打下了基础。它现在仍是计算机软件科学的重要基础。