亚马逊推动云服务从S3向Glacier转移

Amazon Web Services(AWS)启用一个新设施来将S3云存储服务的数据迁移到新的Glacier云归档服务。

Glacier是在几周前推出的,面向美国大部分地区按每月每Gb 0.01美元的价格提供云存储(加州北部部分地区和爱尔兰的价格是0.011美元,东京的价格是0.012美元),比S3的0.125美元的价格要低许多。

存储在Glacier的数据不是马上可用的,需要三到五个小时的额定恢复时间。与此相反,S3上面的数据是实时可访问的。

那些希望简单的“将数据发送给Glacier”的用户要失望了,AWS的架构是在两个服务之间迁移数据。S3用户可以在S3面板上激活属性功能,然后选择使用一个“生命周期”控件。这个“生命周期”控件可以让用户创建规则,决定数据什么时候应该被迁移到Glacier,同时还提供了了数据过期的选项。

这些规则要求用户输入一个前缀,而且看起来这些规则只会在文件名字前出现这个字符的时候归档文件。对于那些在S3中有很多文件并且不耐烦重命名文件名的用户来说,所需要做的就是将文件传送给Glacier。AWS论坛上的一篇文章表示不提供前缀意味着所有文件都将在Glacier中放在一个篮子里“冻结”。

有关新服务的博客文章还提供了一些新的有关如何将数据从Glacier恢复到S3的细节。

S3上新的RESTORE命令让用户可以开始恢复数据的流程,这个流程要求用户规定一个保留时间。一旦用户设定保留时间并且数据恢复,AWS表示下面的事情将会发生:

“被你恢复的对象将同时保留在Glacier和S3的Reduced Redundancy Storage(RRS:去冗余存储)上,S3上的保存时间就是用户的保留时间。在保留时间结束后,对象的数据将从S3上移除;对象将继续保留在Glacier。”

虽然新的有关Glacier操作的细节还是受人欢迎的,不过AWS仍然闭口不言Glacier背后的技术。三到五个小时的恢复时间意味着无论Glacier使用的是哪种存储媒介都有很慢的寻找时间或甚至必须在数据传输开始前将媒介放到线上(可能是物理的方式)。磁带是很可能的存储媒介,也有可能是在用于归档数据的降速磁盘上使用Copan的MAID(大规模非活动磁盘阵列)。

可惜的是,AWS不肯给出直接的答案。我们上次问到的时候,AWS只是说Glacier使用“低成本的商品硬件”。

无论Glacier使用的是什么硬件,它给传统存储厂商带来了挑战。AWS最近发布的云存储网关可以在内部套件和S3之间进行分层,意味着云公司现在可以为用户提供三个存储层,并提供自动化的手段来在三个层之间迁移数据。虽然它可能不能提供像硬件销售竞争对手那样精致的自动化,但肯定也不能小看。