存储误区:专注于数据 而不是存储介质

很多企业都在犹豫使用磁盘还是磁带来存储数据,事实上,企业的侧重点应该放在数据上,例如数据是如何被使用的以及数据需要存储多长时间。决定使用何种存储介质设置很多因素,例如成本、可靠性、数据完整性和可访问性。数据保护的首要目的是最纯粹的形式的数据保存,而不是简单地选择一个存储介质来存储数据。

数据生命周期:比听起来更复杂

数字数据有其自身的复杂的生命周期:根据法律程序被创建、使用、存储、检索、修改和删除等。管理数据就像数据生命周期那样复杂。

数据保护:没有听起来那么复杂

虽然管理数据存储复杂性,但保护数据主要围绕两个关键点来进行:

• 即时访问

• 较长时期的保护/数据完整性,也就是说,你需要能够在任何时候存储数据或者使用数据。

这两个关键点也描绘出了磁盘和磁带之间的战争战线。磁盘推崇者注重通过使用磁盘能够快速访问数据。磁带推崇者则注重磁带的优势:较长时间的保护,以及高数据完整性。另外还涉及成本、部署难易程度和管理难度。为了做出正确的选择,用户需要了解以下问题:

• 每个存储介质的优点(和缺点)

• 数据是如何被使用的,如何进行最好的保护

每种存储介质的优点和缺点

评估如何选择正确存储介质来保护数据,首先要先了解磁盘和磁带的相对优势和劣势:

存储误区:专注于数据 而不是存储介质

数据保护规划的实践考虑

在了解每种存储介质的相对优势后,然后,你就可以评估数据本身的需求:即,数据如何被使用,数据需要得到怎样的保护

访问模式 每个企业都是独特的,管理员需要选择适合自己企业的数据访问和保护战略。首先所有企业第一个需要考虑的是在数据生命周期中,存储数据被访问的频率如何?需要充分了解数据使用模式。Enterprise Strategy Group行业分析师的调查发现,94%恢复的数据的寿命都低于2周。

存储误区:专注于数据 而不是存储介质

研究结果与大家广泛接受的观点保持一致,即使用磁盘作为数据保护战略的第一站。当数据移出磁盘时,在最初的几个星期,数据都很少被访问。在过了这几 个星期后,数据可以被移动到不太昂贵的存储介质(例如磁带)。这意味着磁盘在从主存储介质移出几周后可以移动到磁带,而不是几个月后。这里就可以省下一大 笔开销。将数据在磁盘上存储一个月,当用户需要时,数据仍然可以访问,而过后将数据移动到磁带,磁盘空间被释放,数据存储成本下降。

成本 磁带比磁盘的成本要低,这是众所周知的,并且也有相关研究证明了这一点。下图使用Clipper Group报告数据说明了磁带和磁盘的运营成本差异。

存储误区:专注于数据 而不是存储介质

数据完整性和可靠性。 根据数据完整性和可靠性来选择存储介质要比单纯依靠成本因素来选择要更加可行。在数据生命周期中,瞬时数据访问不再需要,可靠性和可见索性成为主要要求,这些也正是磁带的显著优势。

可靠性是关键,因为好的管理和最佳做法能够确保长期地保护数据。很多人都很惊讶的发现,磁带要比用于后初存储的磁盘更加可靠。事实上,磁盘(最常见的是SATA)的寿命相对较短,可靠性也不必磁带。磁带比磁盘更加可靠,不同介质的错误率可以说明这一点:

LTO磁带: 1 x 10E17 bits中有1 bit

企业磁带: 1 x 10E19 bits中有1 bit

桌面SATA: 1 x 10E14 bits 中有1扇区

企业SATA: 1 x 10E15 bits中有1扇区

企业FC/SAS: 1 x10E16 bits中有1扇区

磁带要比主要企业磁盘(除了固态磁盘)更加可靠。当将SATA与磁带相比较时,磁带的可靠性更为显著,因为SATA和磁带都是用于后初存储。10-14 (SATA)到10-19 (企业磁带)的错误率的区别意味着在磁盘上的数据要比存储在磁带的相同数据更有可能存在错误。

为什么要使用磁盘呢?

磁带具有高可靠性和低成本,那么大家肯定会问,为什么磁盘还会存在于数据保护战略中呢?数据从主要企业级磁盘存储移动到更具成本效益的磁盘(通常是 SATA),能够让用户快速检索数据,而不需要管理员使用备份应用程序来找到磁带和恢复数据。当用户需要单个文件或者一小部分文件时,这显得尤为有用。这些数据是通过磁盘快速访问的访问来搜索存储数据的。

磁盘在数据保护过程中有着显著的优势,它能够作为备份数据的聚合器。单个磁盘驱动器的速度要比单个转盘式驱动器更加快,不过两者都会受到网络速度的 限制。通常情况下,数据为了备份目的穿越网络的写入速度很慢,低至30MB/s。磁带一次只能接受单个数据流,所以磁带吞吐量受到输入数据速率的限制。这 导致磁带的速度也很慢,不过主要还是网络速度制造了这个瓶颈问题。磁盘可以一次性接受多个数据流,所以通常被认为比磁带更快。磁盘中配备的错误苹果能够解 决网络速度慢的问题。磁盘还提供了对单个文件或者少量文件的快速访问,这也是磁盘被认为比磁带快的另一个原因。

磁盘聚合多个数据流的能力能够显著加快整个备份过程。数据聚合后,数据到磁带的传输就只受磁盘速度的影响,这通常比磁带传输速率要慢,但比网络传输速率更快。

对磁盘的使用改变了传统备份形式,提高了备份速度,减少了备份窗口。在数据保护战略中使用磁盘,能够减轻管理员的工作量,例如涉及从磁带检索小文件的工作,并且加快了备份过程。

为什么使用磁带?

了解了磁盘的优势后,一些推崇者就决定从此使用磁盘,并从此让磁带从数据中心小时。这种方法已经有人尝试过了,但是并没有成功。研究表明,68%只 使用磁盘的数据中心计划将磁带添加到他们的数据保护战略。这是因为磁带提供一些磁盘无法比拟的功能,正如磁盘能够提供磁带无法比拟的随机访问和数据聚合等 功能。

磁带对于所有数据保护战略仍然是绝对必要的,因为它具有以下特点:

可靠性

提高磁盘上数据的可访问性(通过使用磁带作为网络附加存储)

支持长期数据保存

灾难恢复规划服务中的固有可移植性

大幅降低成本

数据本身是重点

保护数据的关键首先需要弄清楚存储介质的优点,其次,重点关注数据本身。注意结合数据使用模式和介质优势两个因素能够做出关于数据保护的正确决策: 在数据从主存储移出后,大多数数据应该会直接移动到磁盘进行短期访问和数据保护。多有数据都应该最终移动到磁带以确保最佳数据保存。这背后的逻辑很简单, 主要基于短期或长期、可靠性和成本的要求。虽然磁盘和磁带的争论在存储行业一直没有停息,但这很容易解决:同时使用磁盘和磁带。他们都有各自的优点和缺 点,并且使用两种介质能够最大化利用每种介质的优势以节省成本、时间。