作为企业CIO,CIO如何为企业挑选云数据库?针对这一问题,其实开发者和应用设计者对于在云端部署数据库有众多选择,很难做出最佳的选择判断。将数据库服务器在IaaS云上运行好吗?或者应该转换成PaaS选择?数据库即服务的选择可能听起来很诱人,比如Cloudant的NoSQL但是怎么权衡?
为所有的选择列一个提纲有助于这项工作开始,但是不管选择了哪一种云数据库,都需要衡量多种因素,包括成本、可用性、可扩展性以及性能支持。
当前的代码可能很难对接到平台即服务(PaaS)数据库选择;甚至是关系型数据库都无法完全兼容,比如微软SQL Server和Windows Azure SQL数据库。比如SQL Server中,SQL数据库不支持自定义文本操作。
因此,如果当前的应用使用MySQL、Oracle、SQL Server、PostgreSQL或者其他常用的关系型数据库管理系统,构建在三层架构上,可以将数据库服务器转移到基础架构即服务(IaaS)云上。在这种选择下,可以保持配置和管理控制,但是也要持续承担备份、监控和按需扩展(或收缩)的责任。
相反,如果开始一项新的开发或者重新设计一个当前的数据库层,随后PaaS或者数据库即服务(DBaaS)可能会更好的适应需求。要尽早确定是使用SQL还是NoSQL架构。下面让我们来分析下SQL和NoSQL利弊。
SQL和NoSQL都有优缺点,但是有些最为重要的因素则是你的团队开发每一种类型数据库的技能水平,以及每一种数据库类型怎样更好的适应你的需求。擅长技术类型的优势在于你的开发者不会被较长的学习曲线吓到。不要过分强调不需要的功能,即便市场上营销它比其他的数据库得到了更多的支持者。比如,分布式事务两阶段提交对于一些应用很重要,但是你真的需要吗?
基于SQL的关系型数据库平台可以选择PaaS,比如亚马逊关系型数据库服务(RDS)和Windows Azure SQL数据库。亚马逊RDS支持MySQL、Oracle和微软SQL Server数据库。在优化数据库性能时磁盘I/O是重点,因此在对接PaaS或者DBaaS数据库开发时,考虑一下存储的选择。
亚马逊Web服务(AWS)允许客户提供RDS实例,不管是标准的存储还是预分配的IOPS。后者对于事务处理应用是个不错的选择。如果你可以忍受I/O性能,标准存储可以节省AWS费用。客户可以按照1000—30000 IOPS的范围,每月价格为10美分/IOPS。
谷歌云SQL是一个基于云的MySQL实现,针对中小型应用。整合了谷歌App Engine,对于已经使用PaaS的开发者十分适用。不管是打包计划还是每个用例的计划付费都是可行的。
当成本和快速扩展成为问题所在,NoSQL选择可能更适合。NoSQL数据库并不具备我们构建面向事务的系统所依赖的所有性能,但是很适合Web和移动应用,这些应用要求快速扩展。AWS和微软都有NoSQL数据库服务。
亚马逊DynamoDB是一个托管的NoSQL数据库。客户对读写分配容量,基于此支付每小时的费用。AWS根据“读容量单元”和“写容量单元”衡量容量。
亚马逊SimpleDB是另一个NoSQL选择。其首要优势在于成本低。SimpleDB对于小型应用是个不错的选择,这种应用可以接受更低的性能。对于大量数据则需要分区和自动扩展,从而处理负载,DynamoDB可能更适合。
微软的NoSQL产品称之为Table Storage,类似亚马逊DynamoDB,是一种键值对数据存储。这些数据库都是支持大量数据的应用的有利候选,简化了数据类型的关系,可以不用修复预定义模式就获益。Table Storage的价格基于数据量和冗余水平。
除了IaaS厂商之外,比如微软、谷歌、亚马逊,你还可以选择特定的数据库服务,比如Cloudant的数据库即服务。Cloudant提供多租户和专用MongoDB数据库服务,价格起始于每月每GB1美分,加上额外的HTTP请求费用(如GET、PUT、POST和DELETE)。