云计算时代,计算领域每投入一元钱,存储领域就需要投入两元钱。作为以服务交付为价值点的云计算来说,其存储尤其是云存储在其中所扮演的作用也就十分重要。对于早在 2009年就提出开源存储方案的Backblaze来说,将迎来“借云计算之势”爆发增长的黄金期。那么,这种存储开源是否意味着打开了“潘多拉之盒” 呢?
前段时间,由Facebook主导的Open Compute Project,在经过一年半的发展,已经涌现出更多的基于开放的定制化解决方案。其实在计算开放、开源化的同时,包括硬件存储在内的硬件也在走向开源。
2009年就提出开源存储方案的Backblaze,就是将这种存储引向开源的一家初创企业。这家企业主攻在线备份和数据备份软件解决方案。这家公司曾经推出的Storage Pod 1.0,创新性提出了硬件存储开源化的理念,并成为存储大数据最具成本效益的方案之一。
Storage Pod 1.0(Pod是指存储海量数据的4U机架)标准下,用户只需支付7867美元就可以享受到67TB的数据存储,并支持在线备份。随后,升级到了2.0和 3.0版本的Storage Pod。Storage Pod2.0在前一版本基础上实现了容量翻番(135TB)且价格更为低廉的解决方案。Backblaze通过在4U机架空间内安装搭配45个磁盘的服务器来实现存储硬件的开源化。其5美元每月的无限备份服务颇受关注。
Storage Pod 3.0
Backblaze Pod有点类似此前Sun X4500“Thumper”平台支持热插拔硬盘。此次第三代Pod有很多重大升级。下面,我们将为大家详细介绍这方面的内容。
在上一代2.0的基础上,Storage Pod 3.0在箱体、重要部件方面都全新设计进行了升级,以帮助提升可靠性和灵活性。通过目前单体4TB硬盘,在4U机架中可实现最高180TB扩展(45*4TB)。
该4U机架中的45个硬盘位分为三组,每组15个,任何一组都被固定住。每组都扮演着硬盘之间的数据传输通道角色。这使得Pod的组装会变得更为容易和高效,最为重要的是,还可以提供缓震效果,为数据保护提供更多保障。
Storage Pod 3.0原型图
据悉,该产品采用第二代英特尔i3-2100处理器,相比上一代产品可提供更多内存支持(32GB),而且也拥有更多的能耗节省(65瓦),主频为3.1GHz。搭配微型ATX架构主板,当然也支持标准ATX架构主板。根据介绍,Pod 3.0采用的是超微MBD-X9SCL-F板子,该主板新增了英特尔高级处理总线的支持和PCIe扩展插的升级(提供两倍的I/O吞吐)。
4U结构设计(其中一组磁盘裸露在外)
也许有人问,4U空间内安置这么多磁盘,其散热设计是什么样的呢?Pod采用了1+1冗余电源设计,分别独立对板块和磁盘、两组6个大功率风扇提供电源。两组大功率风扇从磁盘两侧和系统主板分别提供散热支持。
电源和风扇系统设计示意图
Storage Pod 软件层结构示意图
在软件层面,我们也可以从图示中了解,它包含了硬盘、RAID和文件系统、网络连接支持。用户可以通过fdisk等工具在Linux系统上对SATA控制器下的45个硬盘进行分区创建,并将每15个硬盘集群化组建成RAID6。在这之上就是JFS文件系统了,通过HTTPS协议即可访问文件系统并对磁盘进行操作。
一直以来开源都在软件领域挥舞着大棒。在云计算的当代,硬件领域尤其是OCP开放计算项目等领域, 已经将这种开源引入到了硬件层级。Backblaze则主要是在存储硬件方面实现开源,通过在一个4U机架中部署密集磁盘,并通过网络服务交付的形式,为用户提供在线备份、存储等服务。
那么,该公司的这种开源存储设计方案,对于其他存储厂商来说是否意味着打开了“潘多拉之盒”呢?一方面,Backblaze存储系统的设计都是透明的,包括每个组件的成本和结构组成都一目了然。另一方面,它提供了类似攒机的市场模式,用户无需购买昂贵的存储设备,只需订阅因大量的存储系统部署而带来成本效益下的存储/备份服务。
Storage Pod存储开源(成本、设计透明)
这种设计理念,开创一种存储定制化的服务模式,用户可以通过更改组件、磁盘、或者重新设计4U机架箱体来实现某些功能模块的增强(比如计算或者网络 I/O负载)。Pod 3.0成本相比2.0降低了1.9%,也就是从Pod 2.0的1984美元降至1942.59美元,其他成本则主要是硬盘上面。前几年泰国洪水和IT融合的趋势,导致硬盘产业趋于供不应求的阶段,但早在2011年就推出的Pod 2.0在一定程度上有助于节省硬盘成本。目前该公司拥有450个Pod,部署和管理的数据超过50PB。并受到来自全球各企业、组织用户的青睐。
Storage Pod(4U)
编后语:
也许多年以后,人们会发现这种存储开源会类似戴尔当年专注于优化成本在品牌PC市场中实现逆袭那样,用户不再需要购买品牌机,而是自行组织(定制化配置)存储设备实现成本节约。诞生,传统的存储厂商并不会改变自己的产品设计,IDC和其他IT服务提供商也并不会为此而做出大容量存储架构的定制化设计。
Storage Pod
这些现状其实也为Backblaze这类的厂商提供了发展机会,尤其是在大数据时代,人们包括中小企业都会有更多的数据存储需求(大型企业机构一般都有自己的数据中心、大型存储阵列),这些需求往往会因为数据的海量增长而带来成本压力的持续上升。
在这种情况下,存储开源的到来对传统存储厂商是否意味着打开了“潘多拉之盒”呢?但不管怎么样,对于用户来说都是一件好事。