七牛云存储总裁吕桂华全球云计算大会答记者问

9月16-18日,由UBM主办的2014全球云计算大会在上海国际会议中心举行。这是大会继2013年首次亮相中国后的第二次亮相,大会通过会议与展览相结合的运作模式,为参与者提供全方位、多维度的云计算解决方案。

国内领先的企业级云存储服务商七牛云存储应邀出席,七牛总裁吕桂华在企业云架构专场进行了《云时代的企业数据管理策略》分享。分享结束后,吕桂华就七牛相关问题回答了现场记者和嘉宾的提问。

问:刚刚您提到了七牛的产品,类似于亚马逊的S3,那其实我一直对七牛这个产品有疑问,亚马逊的S3,跟其他产品比如云主机是一起的。但是七牛是提供对象存储,不知道这个问题您是怎么看的?

吕总:为什么我们不认为云主机是很关键的,我们分析了一下,不同的数据之间什么情况下需要流通。您刚刚提到的,云主机跟我们现在的存储系统之间,它什么时候会需要发生数据流量,这个是我们真正在关注的。我们其实现在划分,就是所有的云服务器,就分成我刚刚说的三类管理系统。云主机主要是围绕数据库的计算,所以它跟数据库待在一起。因为它跟数据库之间的对话会非常的频繁,必须是在局域网里面进行。但是云主机跟我们的非结构化数据,到底是否必须在一起呢?这个不一定。这个要看它有几种场景,因为我们构建的是一个非常完整的非结构化数据的管理周期,就是它从一开始,最终用户上传的时候,就是直接上传到我们这边的。然后处理也好,存储也好,分析也好,下载也好,全是走我们这边的。然后它跟云主机之间肯定还有通讯,这个通讯的话,我们现在的通过跟我们大量的客户的,他们到底怎么用我们,这个用法是千奇百怪都有,但是通常产生的数据交流是源数据,就是比较常规的用法就是一个用户,我们的客户产品的某个用户,他上传数据之后,上传完整了之后,我们会通知云主机,告诉它某一个文件名为什么的文件上传完成了,只是这样一句话,因为这句话数据量只有几个字节,跨局域网也好,跨公网也好,它的影响很小,因为现在的话,机房跟机房之间的延迟,已经能做到只有几十毫秒,跟局域网只差几十毫秒,是可被接受的。当然最好我们也有云主机,但是我刚刚讲了这个逻辑,我们认为云主机不太关键,在合适的时候,我们会考虑。

问:七牛说能达到16个9,是可靠性还是持久性,这16个9的含义是什么?

吕总: 16个9其实是学术概念,是概率论的问题。就是多少个9,在可用性和可靠性上它的解释是不一样的。通常的云服务它通常有两个指标,一个是数据可靠性,一个是服务可用性,服务可用性就是你这个服务出错的概率是多少。然后服务出错,因为它有多种原因,一个是服务压力太大,也会出错。因为压力太大的时候,你访问过去,可能会返回50几,这个50几,是认为错误的一种状态。所以可用性,所以它通常不会非常多的9。最多99.99%,亚马逊能承担的,它写的可用性是99.9%,只有三个9。但是可靠性有很高。可靠性是说你当前的技术架构、运营机构下,它包括了两个,技术架构就是你的技术设备怎么样的,这两个结构下,所达到的数据丢失的概率是什么样的。我就拿个简单的作为比方,如果你数据没有备份,存在一块硬盘上,这块硬盘寿命是五年。那你丢失数据的概率就是五年,这个五年可以转成多少个9,这个是个数学问题,这里不讲了。然后你存在十硬盘上,每块硬盘的寿命是五年,每一块都可能在五年之内任意损坏,你损坏的概率就变成半年,因为五年的1/10,这个是概率论的问题,当年有成千论万块硬盘,就变成你每天每秒钟都可能有一块硬盘损坏,所以在这种情况下,怎么样假设让硬盘必然损坏的情况下,数据还不丢,这个是我们的逻辑,大致上算法是公开的。多少个9的算法是公开的。你感兴趣的话,可以做一些针对性的搜索,就能找到。

问:一个您刚刚说到的数据上传,这表示客户手工上传,还是有一些自动可以抓取数据。因为有很多数据,手工上传不太可能,有没有工具可以上传?

吕总:这个跟我们跟客户之间的合作模式有关系。我们现在很自然的,作为个人用户,会发现网盘有自动上传的能力,就是你在PC上装了一个,像国内的金山快盘,它会自动的帮你设置的文件夹里面,把文件上传,在我们看来,这个是一个APP的能力,我们不需要提供的,因为这个不是共性的需求,有一些需要自动上传,有一些不需要自动上传。所以我们要提供一个共有的需求,就是上传。但是这个可能涉及到另外一块,就是数据迁移,数据的迁移我刚才提到说,我们可以提供软件,这个软件的话,当你数据量在一定程度之内,是可以用软件来跑的,我们跑一下我们的软件,把这个软件对应的文件夹里面所有的数据全部迁移到平台里面。但是数据量太大,跑几个月还没有跑完,这个就不现实了。我们提供的办法是寄硬盘,听起来很土,但是很实用。

问:数据上传有没有加密?

吕总:我们在云端缺省状态下,数据是不加密的,这个跟客户的需求有很密切的关系,我们主要做的事情是数据的分块,分块跟打乱,这个有一定性的安全性的效果,但是不能认为是加密。只要做云存储的,肯定都不是做加密的。因为加密它本身也是一个应用层的需求,因为加密它一个非常大规模的计算,密度是很高的计算。有一些网盘,比如说我知道的,我们这个大块是有一个书生云存储,它的卖点是安全。它可以在数据上传之前,就在客户端做好加密,然后上传,这样即使网络传输的中途被截取,他也无法理解你这个文件的内容。如果我们这一端加密了,传输过程中还是不安全的。就是它还得解决传输中的安全问题。对于我们来说只是一个服务的问题,我们可以在真正存储之前,先加密,但是这个先加密在我们来看就是处理地过程。另外一个是保证传输过程当中的安全性。

问:贵公司为什么叫七牛信息,是不是数据太大,需要七匹牛来拉?

吕总:七匹牛能拉动的数据不是很多,我们还要大一些,至少八匹牛拉才行。这个名字是我起的,所谓名字是什么意思,因为起名字是很复杂的一件事情。起名字关键就是要让大家能记住。能够被人问你为什么叫这个名字,就成功了,大家就能记住你这个名字了。

我另外一个联合创始人回答过这个问题。其实我的回答才是官方的,因为我起的名字。整体回答就是我们试图回答一个理念,就是做服务是一个稳的东西,牛是一个很稳的形象。除了发疯的牛,正常情况下的牛是很稳的很可靠的,这也是我们在内部反复强调的企业文化叫简单可信赖。我在做内部企业文化培训的时候,我用了一个形象,不是牛,因为牛实在太直白了。我问大家,所谓的简单可信赖,它真正的展现是什么样子的。我当时给了一个形象,就是一个三角,三角其实就是现有的三角板的结构。三角是现在建筑结构里面最常见的一个结构,它简单,但是从不出问题,这个其实是我们反复去强调的一个理念,就是你一定要做得足够简单,才是可信赖的。这个简单的话,就是第一步我们的组织要足够的纯粹,不是很少的人,而是100个人,尽可能要看起来像一个人,之间的沟通成本要够低。大家有事说事,有问题提问题,该骂就骂,千万别带着面具说话。这个是我们非常重视的企业问题。我相信很多人感兴趣这样的企业文化,感兴趣的话,可以看看我们有没有适合你的工作。