中国灾害性气候高性能运算项目
1. 项目背景
2011年初,中国灾害性气候高性能运算项目落户中国科学院大气物理研究所(以下简称“中科院物理所”),为高质高效地完成项目的建设任务,中科院物理所提出了一站式,端到端的方案要求。所谓一站式,就是要求整体方案要在规划、部署、维护三个阶段具有技术支持连贯性;所谓端到端就是要求整体方案要在硬件、软件、网络三个层面具有系统建设整合性。北京趋势未来科技作为项目的承建者,利用戴尔HPCC方案全面满足了客户的上述需求。
2. 面临挑战
首先,HPCC系统从建设到管理都需要化繁为简。
其次,HPCC系统开放性需要进一步提高。
第三,HPCC的客户应用体验需要进一步获得提升。
3. 具体方案
1) HPCC系统
计算节点采用8片戴尔PowerEdge M910刀片服务器。其硬件配置为:2颗英特尔®至强® E7-4830处理器,运行频率达2.13GHz,24MB缓存,64GB 内存和2块146GB SAS硬盘,做RAID1。
I/O与管理节点采用1台戴尔PowerEdge R510服务器。其硬件配置为:2颗英特尔®至强® 5620处理器,12MB缓存, 24GB 内存,2块146GB SAS硬盘做RAID1,并采用了Broadcom 5716双端口千兆以太网卡。
其它方面 第一,计算网络引入了一套40 Gbps Infiniband交换机(32端口);第二,管理网络引入了一套PowerConnect M6220千兆以网络交换机;第三,存储系统引入戴尔MD3000磁盘阵列;第四,所有节点均安装Linux RedHat 操作系统、采用CHESS群集管理软件,硬件系统管理软件采用戴尔Open Manage管理套件。

2) 技术服务
在技术支持与服务方面 北京趋势未来科技联合戴尔为客户提供了三年专业技术支持服务,主要包括如下内容。第一,快速技术响应,确保技术人员在7×24内随时提供远程技术支持,4小时内上门现场故障修复服务;第二,端到端、一站式的全程服务,具体来说,端到端服务是以指定技术经理为单一联络人的统一服务接口负责与英特尔等第三方厂商进行技术协商,协同处理故障的技术服务,一站式服务是指北京趋势未来科技联合戴尔提供全程化的技术支持,包括在调研阶段提供技术咨询服务、在项目规划阶段提供方案设计服务,在实施阶段提供软硬一体的部署服务,在项目后期提供维护和技术培训服务,并可根据客户的需求联合群集系统软件厂商提供集群系统调优,以及脚本文件的定制和开发服务。
4. 实施效果
首先,在化繁为简方面,利用戴尔的一体化方案,最终用户的部署时间可以节省90%,维护负担可以减轻至少50%;
其次,在开放性方面,戴尔HPCC综合解决方案将自身的计算资源、存储资源,与业内最优秀的HPCC软件、网络系统整合在一起,可以让HPCC系统实现无缝化的系统扩容和异构融合,将HPCC系统的整体生命周期延长至少200%;
第三,在用户体验方面,戴尔软硬结合,功能齐备、设计科学的HPCC系统,可以让用户实现全面有序化,专业便捷化、持续科学化的群集管理。 |