CERN如何应对未来EB级的高能物理数据？-DOIT-数据产业媒体与服务平台

欧洲核子研究中心(CERN)成立于1954年，是世界上最大的粒子物理学实验室，主要业务是探索宇宙本源，促进人类进步，培养下一代科技接班人。CERN有22个成员国，主要来自欧洲，合作伙伴遍布全球机构和院校，大约1.2万来自70国家和105不同国籍的科学家来到CERN从事研究, 这是世界上一半的粒子物理学家。2012年，闻名世界的希格斯玻色子(俗称“上帝粒子”)就是在CERN的大型强子对撞机(LHC，Large Hadron Collider)实验中发现的。

近日，CERN IT部门的资源管理团队负责人Jan van Eldik在2017华为全联接大会(HUAWEI CONNECT 2017)上，介绍了CERN正在采用的一些方法，应对未来其实验产生的快速增长的数据洪流。

Jan van Eldik 在Huawei Connect 2017上发言

海量数据的源头

CERN拥有大型强子对撞机LHC——世界上最大的粒子加速器。LHC是一个全长27公里的环(如下图)，位于瑞士日内瓦近郊，贯穿瑞法边境。LHC把环超导磁体安装在地下100米，创造出比地球磁场强10万倍以上的磁场，在抽成真空的磁体管道里，粒子被加速到接近光速的水平，在4个大型实验的粒子探测器里进行碰撞：ATLAS, CMS, ALICE, LHCb。

在大型强子对撞机实验的探测器中，每秒可进行多达10亿次的粒子对撞，我们不可能读出所有这些事件，因此“Trigger(触发)”系统用于层层过滤数据，并选择那些对进一步分析有潜在价值的事件。

这些操作产生的数据随后通过全球LHC计算网格(WLCG，World LHC Computing Grid)的系统从CERN数据中心分发到42个国家的170个计算中心。在撰写本文时，CERN数据中心已经在磁带上存储了超过200 PB的数据，预计每月增加PB级的新数据。

LHC与其试验场景

为什么选择公有云

自2013年以来，CERN部署了一个基于OpenStack的私有云，用于管理位于瑞士梅兰(Meyrin)的主数据中心资源，以及位于匈牙利布达佩斯的远程扩展数据中心。今天，这朵私有云包括大约10,000台双CPU服务器，约300,000个处理器内核，服务于约3600个项目，包括高密度计算，物理数据分析和虚拟服务配置。

计划升级LHC及在CERN进行的更多实验，意味着对计算和存储的需求将大大增加。例如，当LHC的后继者，高亮度LHC在2026年上线的时候，ATLAS和CMS的实验期望收集和重建的碰撞事件比现在多5到10倍。使用当前的软件，硬件和分析技术，所需的计算能力预计比现在高出大约50-100倍。到那时，数据存储需求预计将达到EB级(1EB=109G)。

简单地按ICT新增资源量来等比增加预算，以缩小“资源缺口”是不现实的。为确保资源利用的最大效率，探索新技术和方法至关重要，目前正在研究的一种方法是采用混合模式，在内部资源不够的情况下，CERN可以使用商用的云服务资源来动态扩展其内部资源。

携手Open Telecom Cloud 来应对未来挑战

目前CERN正在通过Helix Nebula(“螺旋星云”)项目来进行公有云试点。今年早些时候，三家公司通过公开竞标被选中进入了“原型阶段”。

其中一家就是基于OTC(Open Telekom Cloud)提供解决方案。OTC是由德国电信和华为共同构建的公共云平台，华为提供基于OpenStack的架构并支持相关的解决方案。在“原型开发”阶段，OTC已经在科学计算领域向CERN交付了HPC公共云解决方案，部署了数千个HPC节点，并分析了高能粒子碰撞的结果。

“OTC最大的优点是基于OpenStack，架构与CERN现有的私有云相同，这意味着它可以灵活动态地扩展CERN的内部资源。”Eldik说。

CERN与华为都是OpenStack开源项目的贡献者，同时，华为还是OpenStack基金会的铂金会员，未来CERN与华为将在OpenStack领域进行更多的深度技术合作

“通过CERN openlab项目，我们已经开始共同努力改进OpenStack，尤其是在大规模运行OpenStack的时候……这将允许OpenStack社区的每个人都从这些社区的努力中受益，我对这些特别的项目非常兴奋，我期待在未来几年看到它们在CERN的云中开花结果，“Eldik先生补充说。

CERN如何应对未来EB级的高能物理数据？

sunk

相关推荐

近期文章

热门标签