盛大云:云计算背后的NoSQL

很多人把NoSQL当作下一代数据库的典范,当然,这么说也并非是没有根据的,7月28日我代表DOIT参加了盛大创新院举办的盛大云计算大会,会中其技术人员分别云计算新产品和下一代称之为“NoSQL”的非关系型数据库Cassandra做了详细的介绍,并就非关系型数据库的相关领域及云计算的推动作用回答了各位记者的提问。

NoSQL与关系型数据库相比较而言还是有很多优点的,它们以键值对存储,它的结构不固定,每一个元组可以有不一样的字段,每个元组可以根据需要增加一些自己的键值对,这样就不会局限于固定的结构,可以减少一些时间和空间的开销。它们可以处理超大量的数据,

它们可以运行在便宜的PC服务器集群上,它们击碎了性能瓶颈,有着Bootstrap的支持。

下面就让我们进入Cassandra的专题:

在此之前很多人对Cassandra都已经近乎于绝望,都说Cassandra不靠谱,这究竟是为什么呢?

(1):Repair:数据修复的可靠性很差;

(2):Scale:插入节点对集群的影响很大/负载不均衡;

(3):Compaction:对性能的影响极大;

(4):Memory记忆存储功能相对来说较差;

通过上述对其的缺点评测,大家可以想想,难道它就没有优点吗?其实它的优点也是极为突出的。

(1):无中心架构,Column Family数据类型;

(2):很快,写操作更快;

(3):性能线性扩展(ref;netfilx;ycsb);

(4):跑分领先所有同类产品;

其功能是非常强大的,使用Cassandra就像文档存储,你不必提前解决记录中的字段。你可以在系统运行时随意的添加或移除字段。这是一个惊人的效率提升,特别是在大型部署上。 Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量,可以指向另一台电脑。你不必重启任何进程,改变应用查询,或手动迁移任何数据。你可以调整你的节点布局来避免某一个数据中心起火,一个备用的数据中心将至少有每条记录的完全复制。如果你不喜欢全部的键值查询,则可以设置键的范围来查询。在混合模式可以将超级列添加到5维。对于每个用户的索引,这是非常方便的。有可以在任何地方任何时间集中读或写任何数据。并且不会有任何单点失败。 关于Cassandra数据库就介绍到这里,希望读者能够通过介绍更深入的了解Cassandra。

下面对云计算新型产品的发展趋势和NoSQL的关系进行一下简单的介绍:

现如今,云计算的发展如火如荼,云产品也随之而涌现,这些都已经是见怪不怪的常事了,但是云计算和这些非关系型数据处理模型有着齐头并进的发展趋势,为什么会这样呢?

因为首先,所有的云计算平台必须提供一些弹性存储模型,否则其经济模式将受到损害。使用的应用程序越来越多,我希望能够根据我实际使用情况来计算我在数据库方面的费用,然后我希望根据实际使用情况来计算我消耗的资源,事实上这是很难使用关系型数据库来实现的。从理论上来说,Oracle公司的RAC可以做到这一点,但是你无法自动分享MySQL。分享它的人必须要投入庞大的手动工作量,并规划各种东西。现实中这是难以实现的。

因此Amazon的SimpleDB和微软公司的Azure Table都是一种非关系型数据库。Google公司也拥有类似的产品。云计算和NoSQL的结合堪称完美。

云计算背后的NoSQL非关系型数据库究竟能走多远,现在我们还不得为知,但我相信它和云计算的发展前景还是非常乐观的。