“现在已经有越来越多的企业会采用Hadoop来管理他们的数据。因此,我们将持续加强对Hadoop的投资,到目前为止我们希望进一步的强化开源社区,希望能够有效的利用英特尔的处理器技术。”在今天的IDF2013上,英特尔公司高级副总裁、数据中心及互联系统事业部总经理柏安娜在主题演讲中如是说道。对于“持续”二字,不难感觉到大数据的戏码正在逐渐加重的味道。
柏安娜讲到,预测到2016年,会有190亿个不同的设备连接互联网。跟2011年比起来,增长很大。而且这190亿个设备中,大部分都是所谓的物联网,也就是机器到机器的连接。比如说监视器、汽车或者是工厂自动化的设备,这些设备都能够连接到互联网。在这些数量庞大的设备背后,都需要强大的数据中心的支持,自然对数据中心的需求会越来越大。
从物联网到数据中心是一个数据分析过程,这也就是所谓的大数据。但是现在面对的挑战已远远大于过去,远非一个公司内的IT部门就能负责的工作。要达到全年不打烊的快速响应时间,还要处理更多复杂的结构化、非结构化数据类型,都是大数据时代的挑战。
英特尔的客户——中国移动就面临了巨大的挑战。因为每一天他们都必须要收集很多呼叫记录。一年的客户就增加了3200万,呼叫的数量也大幅度增长,过去的计费系统已不能使用,因为没有办法为客户提供实时准确的计费资料,所以中国移动要处理的工作可以说是非常的复杂。
英特尔针对中国移动的困惑就采用了Hadoop机架,同时结合应用固态硬盘。因为固态硬盘的特点是读写速度快,比起传统硬盘,每秒I/O次数更高。在Hadoop应用中,如果内存配置不足,会有大量的中间结果写入到硬盘,这样相对较小而且密集的硬盘操作更适合放到SSD中,通过让SSD保存中间数据和临时文件的方式来加速Hadoop应用。在中移动的基础架构获得如此优化之后,不用40秒就可以完成大数据的分析工作,性能足足提升了30倍以上。
在主题演讲中,柏安娜也也介绍了未来几个月将会推出的新品:英特尔即将生产全新的英特尔凌动处理器产品家族和英特尔至强处理器E3、E5和E7产品家族,这些更新的产品将具备更高的性能功耗比以及更多的功能。
至强E7家族产品在内存方面增加了3倍,计算分析方面也更加卓越,而且是针对数据中心的内存分析;核心数据中心至强E5将采用英特尔尖端的22 纳米技术,提高能源效率;至强E3家族,会采用下一代架构Haswell,提高效能的同时降低功耗。新的至强E3将把耗电降到13瓦,降低25%。
最后再剖张展板区英特尔的大数据应用:
高性能计算中的大数据处理
(采用HDFS分布式文件系统作为数据存储,比起传统的RAID5解决方案,HDFS有更好的扩展性,最终实现的优化加速比为6.25x。采用MapReduce做数据处理,)