一、备份软件的功能和作用
磁带驱动器的管理。一般磁带驱动器的厂商并不提供设备的驱动程序,对磁带驱动器的管理和控制工作,完全是备份软件的任务。磁带的卷动、吞吐磁带等机械动作,都要靠备份软件的控制来完成。所以,备份软件和磁带机之间存在一个兼容性的问题,这两者之间必须互相支持,备份系统才能得以正常工作。
磁带库的管理。与磁带驱动器一样,磁带库的厂商也不提供任何驱动程序,机械动作的管理和控制也全权交由备份软件负责。与磁带驱动器相区别的是,磁带库具有更复杂的内部结构,备份软件的管理相应的也就更复杂。例如机械手的动作和位置、磁带仓的槽位等等。这些管理工作的复杂程度比单一磁带驱动器要高出很多,所以几乎所有的备份软件都是免费的支持单一磁带机的管理,而对磁带库的管理则要收取一定的费用。
备份数据的管理。作为全自动的系统,备份软件必须对备份下来的数据进行统一管理和维护。在简单的情况下,备份软件只需要记住数据存放的位置就可以了,这一般是依靠建立一个索引来完成的。然而随着技术的进步,备份系统的数据保存方式也越来越复杂多变。例如,一些备份软件允许多个文件同时写入一盘磁带,这时备份数据的管理就不再像传统方式下那么简单了,往往需要建立多重索引才能定位数据。
数据格式也是一个需要关心的问题。就像磁盘有不同的文件系统格式一样,磁带的组织也有不同的格式。一般备份软件会支持若干种磁带格式,以保证自己的开放性和兼容性,但是使用通用的磁带格式也会损失一部分性能。所以,大型备份软件一般还是偏爱某种特殊的格式。这些专用的格式一般都具有高容量,高备份性能的优势,但是需要注意的是,特殊格式对恢复工作来说,是一个小小的隐患。
备份策略制定是一个重要部分。我们知道需要备份的数据都存在一个2/8原则,即20%的数据被更新的概率是80%。这个原则告诉我们,每次备份都完整的复制所有数据是一种非常不合理的做法。事实上,真实环境中的备份工作往往是基于一次完整备份之后的增量或差量备份。那么完整备份与增量备份和差量备份之间如何组合,才能最有效的实现备份保护,这正是备份策略所关心的问题。
还有工作过程控制。根据预前制定的规则和策略,备份工作何时启动,对哪些数据进行备份,以及工作过程中意外情况的处理,这些都是备份软件不可推卸的责任。这其中包括了与数据库应用的配合接口,也包括了一些备份软件自身的特殊功能。例如很多情况下需要对打开的文件进行备份,这就需要备份软件能够在保证数据完整性的情况下,对打开的文件进行操作。另外,由于备份工作一般都是在无人看管的环境下进行,一旦出现意外,正常工作无法继续时,备份软件必须能够具有一定的意外处理能力。
数据恢复工作。数据备份的目的是为了恢复,所以这部分功能自然也是备份软件的重要部分。很多备份软件对数据恢复过程都给出了相当强大的技术支持和保证。一些中低端备份软件支持智能灾难恢复技术,即用户几乎无需干预数据恢复过程,只要利用备份数据介质,就可以迅速自动的恢复数据。而一些高端的备份软件在恢复时,支持多种恢复机制,用户可以灵活的选择恢复程度和恢复方式,极大的方便了用户。
二、备份技术最新发展
随着存储技术的发展,在SAN、NAS这些新的存储架构中,备份技术也发展出了LAN Free Backup、Serverless Backup等全新的技术。
所谓LAN Free Backup顾名思义,就是指释放网络资源的数据备份方式。在SAN架构中。备份服务器相应用服务器发送指令和信息,指挥应用服务器将数据直接从磁盘阵列中备份到磁带库中。在这个过程中,庞大的备份数据流没有流经网络,为网络节约了宝贵的带宽资源。在NAS架构中,情形十分类似,磁带库直接连接在NAS文件服务器上,备份服务器通过一种称为NDMP的协议,指挥NAS文件服务器将数据备份到磁带库中。细心观察之下会发现,这两种方式虽然都节约了网络资源,但却增加了服务器的工作负荷。下一代的Serverless Backup技术就是以全面的释放网络和服务器资源为目的的。
Serverless Backup技术的核心就是在SAN的交换层实现数据的复制工作,这样备份数据不仅无需经过网络,而且也不必经过应用服务器的总线,完全的保证了网络和应用服务器的高效运行。目前一些厂商推出了自己在这方面的相关产品和解决方案,但是比较成熟且开放性好的产品还在进一步发展中。到目前为止,Serverless Backup技术已经成为所有相关厂商争相追逐的目标,无疑是备份技术领域内最大的热点,相信在不久之后,用户就可以真正享受到这一新技术带来的成果。
除了备份架构的新进展之外,在备份介质选择上,也出现了一些新的趋势。
传统上备份介质主要是磁带设备为主,这主要是因为磁带在单位容量的成本上,较之其他介质具有非常大的优势。但是随着技术的发展进步,尤其是ATA技术的发展,硬盘的成本在迅速的下降。现在,在一些场合下,磁盘作为备份介质其优势已经越来越明显。一些厂商正在着力劝说用户采用更加方便高效的磁盘代替磁带作为备份介质,更有一些厂商甚至推出了包含磁盘和备份软件的整体设备――备份一体机。
事实上,磁盘作为备份介质的最大好处就是其介质管理工作的简化和性能的提升。前面提到过,一个磁带库的管理工作非常的复杂繁琐,如果考虑到对不同厂家的不同型号的磁带库产品,都提供良好支持的话,工作无疑是极其艰巨的。而磁盘介质则几乎不存在这样的问题。这也是备份软件厂商看好磁盘备份的理由之一。
然而,磁带介质本身的技术发展并没有受到这一理念的冲击。相反的,就在磁盘介质向离线存储领域进军的同时,磁带介质也借数据迁移技术的发展,大踏步的向在线存储领域发展着。
数据迁移技术也称为分层存储管理,是一种将离线存储与在线存储整合的技术。传统上,离线数据是静态的,无法实时的被访问,而数据迁移技术正是冲破这一限制,将离线的数据与在线的数据统一调度,从而实现所有数据的实时访问。与磁盘备份技术相反,这一技术的主要目的就是以一定的存储系统性能为代价,换取大型海量存储系统的总体拥有成本。
数据迁移的工作原理比磁盘备份技术略为复杂。简单的说,就是将大量不经常访问的数据存放在磁带库等离线介质上,在磁盘阵列上只保存少量访问频率高的数据。当那些磁带介质上的数据被访问时,系统自动的把这些数据回迁到磁盘阵列中;同样,磁盘阵列中很久未访问的数据被自动迁移到磁带介质上。从某种意义上讲,磁盘阵列以一个磁带库的“中间缓存”的方式被使用,既保证了大多数情况下数据访问的响应性能,也避免了大量利用率低的数据长期占用成本较高的磁盘空间。