当美国网络拍卖商eBay在2003年夏天通过合作伙伴易趣网在中国开店以后,世界就成了它的地盘。它们凭借DIY自主商业模式和硅谷的商业头脑打入了世界上最有潜力的市场,这可谓是天作之合。
同年,淘宝网开设了自己的网上购物商城。该公司既没有辉煌的业绩,对于成为市场主导也只有一线希望,但是与地位稳固的竞争对手相比,它有一个明显的优势:免费发布。
现在仅仅在六年的时间内,淘宝网在网上或线下交易量方面就赶超了中国的其他任何零售商。而该公司今年的预计销售额为190亿美元,甚至一跃超过了美国的 Amazon。1
淘宝网在其博客上发布的一天工作总结展示了2009年9月一个工作日的销售数据:781,922件家居用品、656,648件服装用品和化妆品、496,807件珠宝首饰、138,245件小家电用品、113,769部手机和笔记本电脑。淘宝网那天销售了4,561,000件商品,处理了64,808笔交易。2
数据的海洋
在迅猛发展的过程中,淘宝网一直在不懈努力满足用户的需求。与eBay一样,淘宝网不销售任何自己的产品,而是为买家和卖家提供界面、在线销售工具和交易处理。每件待售商品都附带说明和相片,因此每天产生的数据量着实成为一大问题。
为了管理蜂拥而至的图片、文本和客户数据,淘宝网的每个部门都创建了自己的存储和备份解决方案。淘宝网数据库产品团队主管冯江(音)回忆说:"每个人都在创建自己的控制节点,但是容量总是不够,因为我们每天都在发展。我们需要整合我们的数据中心,并制定一个统一的备份计划。"
可伸缩的解决方案
为了给数据营造一个统一的环境,能够提供最高的可用性保障、自动备份以及可满足未来发展需求的可伸缩性,淘宝网求助于华为赛门铁克。这家公司是华为与赛门铁克在中国成都联合创办的合资企业。华为赛门铁克为淘宝网的IT团队推荐了一款组合的软件和硬件解决方案,该方案能够满足该公司继续发展壮大的需求。
评估完毕后,淘宝网部署了一个1.5PB的华为赛门铁克Oceanspace N8000 Cluster NAS存储系统,以及一个包含 赛门铁克TM FileStore软件的解决方案,该集群NAS存储系统方案能够对备份和恢复、动态存储分层(DST)和数据快照进行整合管理。第二台华为赛门铁克Oceanspace N8000部署在一个"active-active"系统中,从而让淘宝网的服务器能够访问复制的常用数据库,以便进行故障切换。
该团队还部署了Veritas NetBackup,以进行集中的数据保护。通过将 NetBackup与N8000和FileStore相集成,可以实现更快速、更便捷的备份。
组合的解决方案具有高度可伸缩性,这是部署过程中的主要考虑因素之一。冯江解释说:"对于淘宝网来说,很难制定一个超过一年的完善计划,因为业务发展的速度太快了。因此集中管理和出色的可伸缩性对我们来说至关重要。内置了赛门铁克 FileStore的华为赛门铁克N8000 可以扩展到 15 PB,完全能够满足淘宝网一段时间内的需求。"
将每小时停机损失 200 万美元的风险降至最低
每天销售数百万件产品需要最高的可用性保障。由于淘宝网是从它的网站处理所有发布信息、照片和交易,因此发生一分钟的中断就可能让公司损失 36,000 美元。3 冯江解释说:"在淘宝网上,我们每天有数百万件上架待售商品,而我们的客户依靠我们的网站来处理从上传商品到管理帐单在内的一切事务。"
借助新的华为赛门铁克Oceanspace N8000中提供的统一高带宽存储解决方案和赛门铁克FileStore,淘宝网的IT 团队对于提供高可用性保障信心十足。由于N8000采用了先进集群架构设计,各节点之间实现了工作负载均衡,集群架构和负载均衡的设计可以避免节点故障带来的风险。因此即使数据中心内的服务器发生故障,服务依然可以照常提供。
备份效率提高四倍
淘宝网的团队还深知,他们需要比其过时的传统NAS系统更高的效率和可靠性,因为该系统需要通过网络数据管理协议(NDMP)来执行备份。通过使用 Veritas NetBackup来统一存储和管理关键业务数据备份,淘宝网可以提供持续的数据保护和复制,同时可以缩短备份时间,并让IT能够恢复到任意时间点。
利用华为赛门铁克提供支持的集群网络连接存储 (NAS),淘宝网现在不仅对于所有部门拥有一个可靠的数据备份解决方案,同时还最大限度降低了成本和复杂性。冯江说:"华为赛门铁克OceanspaceN8000与集成的Veritas NetBackup数据保护解决方案一并提供,从而使我们能够拥有统一、简化、基于策略的备份系统,能够显著降低我们的维护成本。现在我们的备份效率提高了四倍。"
以动制动
由于淘宝网的发展势头一直非常强劲,因此淘宝网的团队力求将其它华为赛门铁克产品功能集成到其环境当中。为了能够根据数据的实际使用量对其加以组织,该团队将激活赛门铁克 FileStore 中的一项功能 – 动态存储分层 (DST)。
动态存储分层能够将数据动态移动到不同的存储层,以快速响应淘宝网不断变化的业务需求。经常使用的数据可以存储在第一层存储上,而不常用的数据则可以驻留在第二层或第三层存储上。冯江说:"通过赛门铁克FileStore可以在各层之间自动移动数据,因此淘宝网能够制定自身的数据移动规则,并且随着我们不断发展壮大,我们可以使用更少的资源来管理数据的变化。"
1. 《纽约时报》,2009年8月9日,"中国的网上市场日趋繁荣",作者 David Barboza
2.《淘宝网趋势》,2009年9月19日,"淘宝网每天销售 456 万件商品"
3. 2009年190亿美元的预计收入/一年525,600 分钟=一分钟36,149美元