亚马逊AWS最近将其低成本的大数据分析服务Redshift提供给数量有限的一些用户。您可以将 Redshift想象为一个基于公共云的大型关系型数据库,为支持数据仓库而设计。您也可以期望看到这样的云服务将冲击到数据仓储供应商巨头们 – 譬如甲骨文、IBM、Teradata以及EMC等。
使用AWS管理控制台或亚马逊的Redshift API,企业可以提供一个单一2TB的数据库,或者,他们可以选择16个 2TB的超大容量存储(XL)节点或16TB的8个超大容量存储(8XL)节点的集群。除了2TB或 16TB的存储空间,他们也有15GB或120GB的RAM。定价是合理的,XL节点每小时85美分,8XL节点为每小时6.80美元。
亚马逊称,Redshift可直接集成到亚马逊的其它服务,如S3和DynamoDB,非常适合运行各种相关的数据密集型应用程序及应对不断增长的大数据趋势。
与任何其他技术一样,你必须要考虑Redshift好的方面和坏的方面。这里是一些明显的好处:
·能够提供庞大的数据库,而不必通过昂贵和缓慢的采购过程获得的硬件和软件。亚马逊相关负责人表示,“依赖柱状数据存储和先进的压缩技术,Redshift相比传统的数据仓库具有极高性价比优势。”
·可扩展的处理庞大的资料库的能力,也许远远超出了PB级的范围;
·使用弹性资源的潜力,经营业务时,有足够的速度返回实际相关的结果集;
·相对于长期使用自己的硬件和软件的成本,可能节省大量的金钱。
而缺点则主要如下:
·停电的可能性,并不是说您的内部数据仓库永远不会宕机,但任何故障将会成为公众事件,并且给内部使用云计算带来失望;
·数据迁移和整合的成本,尽管亚马逊声明说“Redshift以十分之一的成本带来相当于目前主流本地数据仓储方案的十倍性能”,但在许多情况下,你仍将需要大量的带宽来从内部系统传输数据到云托管的Redshift ,否则你会被USB驱动器通过联邦快递运送到亚马逊AWS服务所困扰;
·缺乏最佳实践,在公共云托管的数据仓库,我们才刚刚起步,显然还有很多的东西需要学习;
·成本上升的可能性,虽然很多企业会发现云托管的数据库节约成本,如Redshift ,但很多人会发现,他们需要为云计算服务支付的费用比预期的要高得多 – 可能超过了内部部署数据库的成本。
据悉,亚马逊Redshift服务首先在美国东部地区提供,未来几个月将向其它地区提供服务。预计Redshift 将会获得成功,因为很多人会喜欢它。
最新的消息显示,Redshift目前已经获得数据集成和数据治理专家Informatica的支持,后者日前宣布了“用于Amazon Redshift的Informatica云连接器”,可以快速并可靠地将数据移入Amazon Redshift,无论是从企业内部部署的系统,还是其他云应用。
不过,在我们开始迁移之前,有必要打开我们的视野,做一次深呼吸,进行周密的规划。