尧字节(yottabyte)时代来临?

295艾字节(exabyte)的数据就会让地球偏离自转轨道!好,也许我们仅仅是晃动了地轴一点点,但是面对如此天文数字般得数据量,你需要大量的硬盘、磁带、纸张等等来记录,而且恐怕也只是记下了几兆字节。

295艾字节(exabyte)是美国科学促进会发行杂志《科学快讯(Science Express)》中的一篇文章提出来的。文章的作者运用比较复杂的运算手段才得出了这个数字,据说是到2007年我们能够存储的数据量。《科学快讯》是一本严肃期刊,上面也刊载了类似的前沿科技文章,“Tomography of Reaction-Diffusion Microemulsions Reveals Three-Dimensional Turing Patterns(层析成像反映:扩散微乳揭示三维图灵模式)”和“Dynamic Control of Chiral Space in a Catalytic Asymmetric Reaction Using a Molecular Motor(应用分子马达在不对称催化反应中动态控制手性空间)”。这些人绝非酒肉之流,并且没有四舍五入到300艾字节(exabyte)也增加了精确性。

我们不仅仅需要空间来存储那些数据,我们不仅需要备份,还要做一两个拷贝来进行容灾。295艾字节(exabyte)能换成多个泽字节(zettabyte),那么尧字节(yottabyte)还远吗?

根据IDC的调查报告,2010年4季度,“整个磁盘存储系统容量达到了5,127PB,比上年度增长了55.7%。”根据我的数学水平,比我们预计的总量少了290艾字节(exabyte),但仍然能占满许多磁盘。

迟早我们要学会如何摆脱数据。一旦阁楼和地下室被塞满,这些0、1就会溢出橱柜,我们就没有了新数据的空间。你的部门恐怕还没有达到艾字节 (exabyte),但很多企业都已经跨过了PB级的门槛,而对于一些数据量不是很大的部门来说,容量问题也是一直以来的要面对的困扰。

问题是,目前还没有数据清理工具。了解该抛弃什么该保留什么意味着你明白什么是第一位的。了解当前数据存储状态的产品并不多。几年前,数据分类似乎开始流行,很像产品分类或者存储管理仓库中的支撑技术(underpinning technology),或者是垃圾分类技术。数据分类技术很快告吹,不过很快出现“回归”的自动分层存储技术。

你该怎么做?你可以告诉用户自动删除旧文档来进行清理工作。有些人会听从,对吧?我一定是第一个承认我所产生的半数数据将最终成为垃圾数据,于公司或个人都无意义。你也可以尝试采用存储配额的方式限制每个用户可以存储的数据量。这个方法比较有效,但恐怕你会成为公司里的“二号关注对象”,受关注程度恐怕仅次于偷冰箱食物的那个家伙。

根据CBC的新闻报道,加拿大政府很关注减少数据存储量,“联邦政府采购了一个大型机器用来替换掉硬盘驱动、USB拇指驱动、 CD,甚至是那些古老的Beta录影带。 ”怎么会想不到这种做法呢?这是个非常完美的解决方案:大型机器会存储大量的数据。我们希望这个机器“胃口很好”,能够吞噬掉295艾字节 (exabyte)的数据量,并且有很多“巨人朋友”。但有一个CBC新闻读者有另外一个想法:“买些‘大锤’恐怕更方便、便宜。”“而且,也很有效!”

也许可以将所有数据都存储到固态存储上。《Journal of Digital Forensics, Security and Law(数据取证、安全和法律杂志)》有一篇题为《Solid State Drives: The Beginning of the End for Current Practice in Digital Forensic Recovery?(SSD:数字取证恢复的当前实践终结的开始)》的文章,这篇文章中写道,你不用担心溺死于数据,将这些数据放到SSD上好了。在文章摘要中,两位澳大利亚作者写道:“我们进行的实验表明,SSD可以根据计算机的指示,有能力根据自身意志彻底毁坏证据。”如果你需要将存储数据瘦身,这无疑是个好消息,但对固态存储产业来说可就算不上好消息了。

探讨一下相关问题;关于海量数据、磁盘销售量暴涨、数据咀嚼机和固态存储的新闻都出现在这一周。也许这是个预兆。也许是时候为疯长的数据存储寻找一个真正的解决方案了,不仅仅是购买更多的磁盘、磁带和芯片来解决问题。我知道存储厂商已经觉察到需要寻找更多的技术来帮助用户购买更少的磁盘,但也许会有一个智慧的办法,包括一个伟大的想法和一个有用的工具来解决海量数据问题。

原文作者:Rich Castagna