曙光公司成立至今,一直致力于推动高性能计算和高性能计算机的发展。在高端,从曙光一号到曙光4000,直至在08年底推出的百万亿次高性能计算机曙光5000,曙光一直领跑着中国高性能计算机。
在另一方面,曙光也一直不断的进行高性能计算的普及化的。工作在继05年的"高性能平民化"普及推广活动后,在06/07年相继推出了曙光4000W、GridView、TC2600等一系列产品,极大的降低高性能计算门槛的产品。
在2008年初,曙光公司正式推出了第一代基于个人桌面的高性能计算机产品–曙光个人高性能计算机(曙光天潮PHPC 100)。它是一个具有时代意义的产品,将高性能计算机从大规模机房移到了个人的办公桌上,它的推出大幅度推进了高性能计算普及化和平民化。
一)概览
曙光第一代个人高性能计算机(曙光天潮PHPC 100)采用全模块化设计和背板设计,共有五个计算模块,10颗双核/四核处理器,每秒浮点运算次数3000~4000亿次。
PHPC 100高度为3/4米,体积约为0.1m3,重量小于60Kg。功耗在1.5KW以内,可以通过普通的插座供电。运行噪音低于48分贝,适合办公室环境。同时,无需专业的机房和专门的空调进行散热。
PHPC 100标配一个千兆以太网交换模块和1个高性能Infiniband网络(以下简称IB网络)交换模块。最大可支持三套交换网络(2套千兆以太网、1套IB网络)。最大支持2个硬件管理模块(标配1个),提供对整台PHPC 100的管理,并对外提供视频信号服务。另集成一个IOE模块,为每个计算模块提供一个标准的PCI E X8扩展插槽。
PHPC 100共提供6个具有负载均衡和故障切换功能的热插拔500W 交流电源模块(标配4个)。由于系统功耗为1500W,所以最少配置3个电源模块。当分别配置4个、5个、6个电源模块时,系统分别实现3+1、3+2和3+3电源冗余。
(二)外形
PHPC 100高度为3/4米,体积约为0.1m3,重量小于60Kg。在机箱下面,带四个轮子,凭一个人的力量,能轻松的移动PHPC。具体参数如下:
外形尺寸(高×宽×深)763mm×306.5mm×446mm
重量:满置60Kg
(三) 内部结构
PHPC 100共包括五个计算模块,第一个模块为计算兼管理模块,其余4个为纯计算模块。每个模块包括2颗最新的AMD Opteron 2000系列四核处理器。
计算模块直接通过20Gb Infiniband高性能网络和千兆以太网进行互联。
千兆以太网:
千兆以太网作为PHPC 100的管理网络。每台PHPC 100标配一个千兆以太网交换模块,最大支持两个一个千兆以太网交换模块。同时PHPC 100中每个计算模块提供两个千兆以太网接口,分别和两个千兆以太网交换模块相连接。
每个千兆以太网交换模块对内分别和5个计算模块的千兆以太网接口相连接,对外提供四个千兆以太网接口。
Infiniband网:
在PHPC 100中,专为高性能计算设计了一套高性能的计算网络—Infiniband网络。该IB网络采用了最新的Connect X(第三代IB芯片)技术,点到点的单向带宽为20Gb/s,延迟为1.26us。是一套高带宽、低延迟、全交换、无阻塞网络。
在PHPC 100中,每一个计算模块都配置了一块DDR IB网卡(20Gb/s),同时集成了一块IB交换芯片,对外提供10个20Gb/s的IB接口。
硬件管理模块:
PHPC 100标配一个硬件管理模块,最大支持两个。当配置两个时,可实现两个模块之间的冗余。
硬件管理模块内置曙光个人高性能计算机管理软件,可实现共享USB 功能、KVM 切换、计算模块状态、故障定位、开关机等全方位管理控制监视功能。用户可以通过管理模块上的以太网接口,在远程实现对PHPC 100的管理和监控。
另外,硬件管理模块内集成了视频切换功能(KVM),用户在本地或远程,实现对PHPC 100中各个计算模块的视频管理。
(四)软件
PHPC 100内集成一系列的软件,包括曙光个人高性能计算机管理软件、操作系统、曙光集群管理监控软件、高性能计算系统平台软件和部分高性能计算应用软件。
曙光个人高性能计算机管理软件:
曙光个人高性能计算机管理软件集成在硬件管理模块中,实现对PHPC 100硬件的全方位管理和监控,包括开关机、开关计算模块、各个模块的温度的监控、计算模块状态监控和故障定位、风扇的管理、千兆交换模块的管理和监控等等。通过该软件,用户可以在本地或通过软件实现对PHPC 100的硬件层面的管理和监控。
操作系统:
PHPC 100支持WCCS2003、SuSE Linux、RedhatLinux、CentOS等主流操作系统。标配WCCS 2003和CentOS操作系统,出厂安装WCCS 2003。
曙光集群管理监控软件:
PHPC 100集成了曙光最新的集群管理监控系统-GridView。
曙光新一代GridView集群综合管理系统提供统一的集中式监控平台,具备可扩展性、集成性、可靠性和易用性,提供对各种商用、自己研发的管理工具的集成接口,包括直接以Portal的方式集成和抽取各已有管理工具的监控数据以便上层平台能够分析利用,完成对高性能计算机的环境、硬件、软件等各方面进行监控的需求。
系统具有易用性,提供简单灵活的系统部署,人性化的界面和功能设计,方便最终用户的使用,包括灵活方便的个性化设置、多样的内容展现形式。管理系统同时提供个性化、自定义报表输出功能。
高性能计算系统平台软件:
PHPC 100提供了各种高性能计算各类系统软件,并针对PHPC 100完成了软件的优化。包括:
并行环境:各类MPI(包括MPI 1和MPI 2)、PVM等
编译器:GNU C/C++、GNU Fortran、GFortran等
数学库:ACML、GOTOBLAS、LAPACK、ScaLAPACK、FFTW等
基准测试工具:Linpack、PMB、Stream等
高性能应用软件:
PHPC 100提供了各个应用领域中,高性能计算最常用的部分软件,并针对PHPC 100完成了软件的优化。使得很多用户无需在安装、调试、优化应用软件,在拿到PHPC以后,直接使用即可。
高性能应用软件包括序列比对类、分子动力学类、分子对接和药物设计类、气象类、有限元计算类、材料类、计算物理类、计算化学类等软件。