IDF2013:大数据“芯”体验抢先看

4月10日至11日,2013年英特尔信息技术峰会(IDF)将在北京国家会议中心举行。在这届将以“未来,用‘芯’体验”为主题的行业盛会上,大数据依然是不可忽视的热点话题。

从目前的情况来看,各种智能终端设备和移动互联网的飞速发展,以及云计算和社交网络的普及应用,催生了一个崭新的大数据时代,世界各国的政府和企业单位都在不同程度上探讨如何利用大数据技术改善民生或社会环境,和提高商业效率。

大数据落地应用的难点,在于新需求与旧有IT架构的不相适应,这就需要政府和企业单位从整体上重新考虑如何部署大数据解决方案。

作为从个人计算到商用计算、科学计算的全方位的IT架构专家,英特尔一直以其前沿的芯片级技术影响整个业界,积极与合作伙伴协同创新帮助产业的发展,并针对大数据的趋势提供了涵盖芯片端到软件平台的整体解决方案。

在本次IDF大会上,英特尔安排了极为丰富的大数据技术课程,相信这些课程足以满足各种不同口味需求的世界各地软硬件开发人员和技术管理人员。以下是一些大数据技术课程推荐:

课程编号:ACAS002(中文)

主题: 超越 Hadoop* 的大数据: 未来的研究方向

时间、地点: 04/10 15:45、306B

技术级别: 高级

摘要: Hadoop* 将 MapReduce 并行计算带入主流应用。 然而,随着大数据需求和使用模式的扩大,Hadoop 已暴露出诸多局限性。 本课程介绍了英特尔与大学合作伙伴为超越这些限制所进行的合作研究,并强调了为将部分成果应用到生产环境所进行的努力。

涉及的主题包括:

• 基于内存的计算和分析实现

• 用于分析的并行图形算法

课程编号:BIGS001(中文)

主题: 大数据在医疗行业的应用

时间、地点: 04/10 11:15、306B

技术级别: 中级

摘要: 主题包括:

• 何为“大数据”?

• 大数据在中国医疗行业的应用前景

• 区域卫生信息化的大数据

• 英特尔大数据解决方案

• 案例分享

课程编号:BIGS002(英文主讲,中文同声传译)

主题: 大数据和对平台架构的影响

时间、地点: 4月11日 14:30、309B

技术级别: 中级

摘要: 大数据现象正在推动新的使用模式和应用程序呈现爆炸性增长,从而不断提高企业效率和竞争力。这些模式和应用程序能够收集海量的数据,并通过批量分析和实时分析及可视化工具提取有用的信息,以推动人们做出明智决策。

欢迎参加本课程,以了解:

• 大数据持续增长的快速回顾

• 大数据的使用模式

• 为大数据部署高效计算时平台架构的影响

课程编号:BIGS003(中文)

主题: 利用英特尔® 至强® 处理器和英特尔® 为Apache* Hadoop* 发行的软件产品保护您的大数据

时间、地点: 4月11日 15:45、309B

技术级别: 高级

摘要: 大数据 Hadoop* 软件环境会带来大量安全性、一致性和性能方面的挑战。但是,Apache* 开源项目却无法为数据保护或访问控制提供足够的机制,而这对于典型的企业应用却是必不可少的。英特尔® 为Apache Hadoop*发行的软件产品能够提供大幅改进,以应对以上差距。

本课程中,我们将讨论:

• 最近开源的针对 Hadoop 分布式文件系统 (HDFS) 和 HBase* 的全新数据加密和访问控制功能

• 添加至 Hadoop 核心的灵活的全新加密框架,该框架利用了开源 OpenSSL* 加密算法

•一个使用英特尔® 至强® 处理器硬件加密加速的示例

课程编号:BIGS004(中文)

主题: 利用英特尔® 架构处理大数据

时间、地点: 4月11日 17:00、309B

技术级别: 初级

摘要: 大数据现象再也不能被忽视了。庞大的数据量、广泛的数据种类、不断加快的数据生成速度以及从大数据集中获取价值的需求,已经直逼 IT 基础设施的极限。要克服这些限制,必须在数据管理技术方面取得重大创新。

本课程涉及的主题包括:

• 适合于管理大数据的英特尔® 优化解决方案

• 利用英特尔® 技术为传输于数据中心的数据提供压缩、安全性和加密支持

课程编号:EMBS001(中文)

主题: 面向智能交通的大数据和英特尔® 智能系统解决方案

时间、地点: 4月10日 11:15、307A

技术级别: 中级

摘要: 本课程将展示英特尔针对中国客户提供的智能交通系统 (ITS) 解决方案。 该解决方案由英特尔® 为 Apache* Hadoop* 发行的软件、增强型网络硬盘录像机/智能边缘服务器以及大数据设备一体机参考服务器平台组成。 这一解决方案组合采用了多种创新技术和产品,旨在满足中国市场对于 ITS 急剧增长的需求。

本课程涉及的主题包括:

• 中国市场的 ITS 要求

• 英特尔 ITS 解决方案概述

• 英特尔增强型网络硬盘录像机/智能边缘服务器

• 英特尔® 为 Apache* Hadoop* 发行的软件

• 大数据设备一体机参考设计及服务器平台

• 中国市场 ITS 案例研究

课程编号:SPCS004(中文)

主题: 技术解析:大数据及在驱动技术趋势中的角色

时间、地点: 4月10日 15:45、309B

技术级别: 中级

摘要: 数据中心正在以史无前例的创新速度发生变化,以应对大数据所带来的敏捷性和效率方面的挑战,同时在百万万亿次级计算时代充分利用最新的科学洞察。在本技术解析中,英特尔高级院士庞思力 (Steve Pawlowski) 将讨论行业中的一些重要机遇,如实现智能城市和个性化医学等,并概括介绍了如何设计面向未来的技术解决方案,以高效交付这些解决方案。与会者将可以轻松掌握针对下一轮数据中心创新的关键开发路线

展板轮道共话大数据

主题: 展板论道:克服实时分析企业大数据的阻碍

时间: 2 小时 45 分钟(4月10日 14:00 展板论道站13)

技术级别: 中级

摘要: 相比一般 IPDC 使用场景,实时分析企业大数据需要处理比灵活数据模式更为复杂的集合。 传统的 RDBMS 和主流的 NOSQL 解决方案(如 HBase/Hadoop)均无法满足响应性和高并发性方面的重要要求。 要解决这一问题,需要采用分布式内存计算,以实现横向扩展能力和更快的处理速度。 在这一展板论道中,我们将列举现有的开源实时分析项目,介绍我们针对分布式内存计算的建议架构,并分享我们取得一些实验性成果和与中国独立软件开发商合作伙伴一起开展的技术研究。

主题: 展板论道:在英特尔® 架构上分析和优化 Hadoop* 性能

时间: 2 小时 45 分钟(4月10日 14:00 展板论道站12)

技术级别: 中级

摘要: 本展板论道涉及的主题包括:

• Hadoop* 性能瓶颈分析

• 面向 Hadoop 的英特尔® 硬件解决方案,包括固态硬盘 (SSD)、10G 网络和 CPU 加速指令

• 面向 Hadoop 的英特尔® 软件解决方案,包括英特尔® 集成性能基元库(英特尔® IPP)和 VTune™ Amplifier

• 擦除 HDFS 中的编码,特征化和优化

• 其它 Hadoop 调试方法

主题: 展板论道:应对企业数据爆炸式增长:SQL 和 NoSQL 的统一整合

时间: 2 小时 45 分钟(4月10日 14:00 展板论道站15)

技术级别: 中级

摘要: 在本展板论道中,我们将介绍一个针对大数据企业解决方案的统一架构和真实案例:SQL 和 NOSQL 一起应对大数据挑战。

本展板论道涉及的主题包括:

• 企业大数据的挑战和机遇

• 涵盖关系数据、流数据和批量数据的处理模型

• 大数据参考架构

• 大数据迁移加速因素

• 案例研究

主题: 展板论道:在高性能计算 (HPC)中处理大数据

时间: 2 小时 45 分钟(4月10日 14:00 展板论道站16)

技术级别: 中级

摘要: 在一些高性能计算 (HPC) 领域,会生成庞大的数据量,并以结构化格式进行存储。当前的集中后处理工具的处理时间很长。

基于互联网门户数据中心 (IPDC) 的 Apache* Hadoop* 解决方案,我们建议采用以下解决方案来加速数据后处理:

• 将高性能计算结果存储到 Hadoop 分布式文件系统 (HDFS),以利用分布式磁盘 I/O

• 根据运营模式修改 HDFS 的文件块布局,以实现负载平衡

• 使用混合消息传递接口 (MPI) 和多线程替代 MapReduce 来执行操作

• 基于文件块布局信息分配任务

• 重叠数据 I/O 和计算

• 为了缓解网络压力,在通过网络传递前,使用英特尔® 集成性能基元库(英特尔® IPP)压缩所有数据

欢迎加入本展板论道,了解有关此优化战略的更多信息。届时我们将介绍一个对气候系统模型 (CSM) 项目进行优化的案例研究。在这一案例中,后处理时间得到了大幅缩短。