由于现在企业储存的大量数据并没有什么商业价值,因此企业需要设法减少存储的数据量。
你知道吗?企业存储的所有数据中有69%是毫无价值的。 然而,就是那些没有什么用途的数据仍然占用着企业的大量存储资源。这对IT和企业来说具有重要的意义。
我关注的其中一个领域是数据管理、风险管理和合规性(GRC),现在,这个领域并未得到应有的重视。因此我欣然应邀出席了最近在缅因州波特兰市召开的Excellence in Governance,Risk Management,and Compliance Conference(EGRC 2013)大会并发表了关于数据保留的演讲。 此次大会谈到了很多与GRC话题有关的问题,并让我有机会结识了私营和公营企业的许多同行。
我在演讲中谈到的其中一个问题是数据保留管理,包括数据处理和数据保管两个方面。但是我更愿意将这篇文章的重点放在数据处理的需求上面,即减少企业需要储存的数据量为何是一件重要的事?
证据确凿
图一列出了数据保留的各项要求,虽然我一直对其真实性持怀疑态度,但我也没有可靠的信息来源来证明这一点,我只能发表一些暗示性的驳论。
图1:数据保留的各项要求
上图表明,1%的企业数据必须为了诉讼需求而保留下来,5%的数据必须受控以满足合规性要求。另外还有25%的数据是具有商业价值的。 那意味着69%的数据其实是毫无价值的。
也许有人会对这些数据的准确性提出质疑,但是让我们先来进行一项合理的测试:在很大程度上,企业和它们的IT部门主要专注于当前正在发生的事情(当前的交易、电子邮件和分析等),而并不是数据积累的过程。
IT部门就向是数据的监护人一样,而且该部门同时承担着存储和管理数据的成本,但他们并不是那样数据的所有者。可能业务部才是那些数据真正的所有者,对于个人员工来说,他们只是某些特定数据集的管理员。 但是如果员工带着他们的电子邮件离开公司会怎么样呢?那么剩下的数据是否就是再也不会被用到的数据碎片了呢? 谁知道呢?这又该谁来管理呢? 答案是:也许没人来管理那些数据。
进行数据处理的原因
现在我要提出一个问题了:清除掉无用的数据到底有多重要呢?
假如20%的IT预算是用于存储领域,而且你们70%的数据对企业来说是毫无价值的。那就意味着14%左右的IT存储预算被浪费掉了。 各位首席信息官们,这能够引起你们的重视吗? 现在,即便能够通过一些技术将所有没有用的数据都安全地清除掉,那也不一定能够马上在成本节约上看到成效。虽然可以省下大量的磁盘空间,但是企业并不能将已经配置的阵列再卖掉。 坦白说,你能够从中省下来的开支可能远比你以前花掉的开支要少得多(这就好比是旧车折旧的问题)。
释放磁盘空间意味着以后的存储设备采购计划可以延期了,但那并不能马上转化为成本上的节约。但是寻求成本节约最终是为了提高生产力,比如现在资金投入不足但又迫切需要的IT改革,这也许就是解决这一问题最好的理由。
这个问题是一种永远无法彻底解决的问题。那意味着虽然你现在暂时还能容忍它,但是新数据的持续快速增长必然会令情况不断恶化,让这个问题越来越难以解决。
将业务转到云并不能解决这个问题,但是它也许会迫使企业加大对这个问题的关注力度。云计算的其中一个目的是提供服务型IT,即让用户从一个自助服务目录中选择他们想要的服务。 然而,这种令人愉快的体验是有代价的。各种资源被分配给用户并被他们消费掉,这意味着必须使用chargeback(或者至少是showback)。 猜猜看, 一家拥有数据的企业是否愿意为具备3美元价值的数据支付10美元呢?
可能要花很长的时间才能说清数据处理面临的各种难题。这不但是一件很困难的事,它可能是很难处理的,而且可能没有一家科技公司能够解决存储的问题。 另外,还有一些逻辑上和技术上的问题需要解决。数据管理功能必须设定和建立政策。 必须找到一种方法论将优质数据与劣质数据区分开来。 这个过程可能不能通过人工的方式完成,可能需要用到自动化处理软件工具。
从现实的角度来说,也许必须用最小的投资来实现数据量的最大缩减。即使在最理想的环境下,你可能也不得不接受这样一个事实,那就是你永远也不可能做到尽善尽美。 况且,你不但需要解决现在的海量数据问题,而且你还必须使用合适的工艺和程序来避免类似的情况再次发生。清理海量数据并不是一件容易的事,但是企业用户们必须获得合适的工具并制定合适的政策以实现那一目标。
Mesabi沉思
存储需求持续快速增长是当前的一个热门话题,大数据是其中最醒目的因素。海量数据的背后隐藏着什么样的问题?虽然人们似乎还不太重视这方面的问题,但是却又不得不面对数据清理的问题。
如果存储在IT预算中占用的比例为20%,而且现在70%的数据是毫无价值的,那就等于每年14%的IT预算被浪费掉了。正视这一问题是企业用户们需要做的第一件事。 找出解决这个问题的办法需要时间、心理训练和努力,但是这些付出都是值得的。如何解决这个问题令所有人都受益呢?这是我下一篇文章将要讨论的话题。