首 页
公司概况
产品中心
新闻中心
工程案例
技术支持
联系我们
会员专区
解决方案
解决方案
当前位置:首页 > 解决方案
高性能计算群集综合建设与管理解决方案
更新日期:2012-07-17  浏览:6434

 

北京趋势未来科技携手戴尔打造高性能计算群集综合建设与管理解决方案

合作背景:关注HPCC发现新商机,携手戴尔推动自身业务新发展
HPCCHigh Performance Computing and Cluster)系统是一个国家IT技术和信息应用发展到高级阶段的产物,其市场规模日趋庞大。随着HPCC系统应用的不断发展,其在科学计算、气象研究、三维建模、动画渲染等多个领域被越来越多的用户所采用。
然而在实际发展中,HPCC系统也存在着一些问题,这些问题极大地阻碍了HPCC系统向更宽的领域,更深的层面普及和推广。具体来说,首先,技术门槛高管理复杂,HPCC系统涉及操作系统、计算群集、作业调度、状态监控、专业计算等多层次的管理技术应用,且这些管理技术应用都需要专业化程度很高的技术人员有效分工才可以顺利完成;其次,开放性有待提升,在应用层面很多科学计算需要开发专业的软件才可以完成相关工作,因此需要HPCC系统屏蔽硬件细节,以开放透明的方式提供一系列的接口供开发者调用;第三,计算机制需要不断完善,例如群集管理系统要拥有应用级代码的Checkpoint/Restart机制,实现硬件、系统、数据、应用多个层级的协调化调用。
面对上述问题,北京趋势未来科技发展有限公司(以下简称“北京趋势未来科技”)发现了新的市场商机,并制定了以HPCC为发力点,推动自身业务大发展的公司发展新思路。为此,北京趋势未来科技选择与戴尔合作,为最终客户提供高性能计算群集综合建设与管理解决方案。
 
合作规划:HPCC系统力求做到功能齐备、架构先进、计算高效
功能要齐备
功能齐备是指HPCC群集系统要在基础层、系统层、群集层、应用层形成多层次的全方位体系。首先在基础层面,要实现计算节点多种方式的部署功能、支持一套集群多个头节点的安装和部署、支持与硬件无关的远程开关机管理功能;其次在系统层面,要支持Windows CCSRed Hat LinuxSUSE Linux以及Cent OS在内的各类操作系统、支持一套物理集群安装多种操作系统并完成多个不同操作系统间的一键式切换;第三在群集层面,要实现集群系统管理、集群资源管理、集群数据管理、集群个人作业管理、集群计费管理、集群状态监控等功能;第四在应用层面,要提供C/C++Fortran语言编译器,以及性能分析工具、性能函数库、集群工具包和MPI库函数等应用开发环境,提供统一接口将各类专业化科学计算应用程序封装在系统之内。
 
架构要先进
架构先进是指HPCC群集系统要层次分明,整合力强、机制科学。首先,层次分明,群集管理方案只有设计层次分明的总体架构,才可以保证群集管理的扩展性、稳定性、开放性,让群集的各个子系统形成相对独立的环境,帮助用户实现群集系统的灵活配置;其次,整合力强,群集系统要将以往分散于操作系统、集群系统管理、作业调度管理、状态监控等软件中的各个相关管理功能整合起来,让群集计算节点、管理节点、I/O节点从松散的状态转化到一个联系紧密、协同度高、运转高效的群集系统;第三,机制科学,群集管理系统不仅要实现对用户账号的统一化管理和自助式的在线账号注册,而且还要采取基于角色的用户权限管理方式,在计算应用、权限管理、任务处理三者之间形成高效的协调化管理机制。
 
计算要高效
计算平台必须具有高智能、高效率、低能耗的特性。首先,高智能,计算平台可根据客户的计算需求自动调节功耗;其次,高效率,计算平台可根据计算任务的需要自动提高处理器主频,并利用超线程技术满足复杂计算程序的运行需求;第三,低能耗,计算平台要采用节能技术,将CPU和内存自动调整至低功耗状态,在减少能耗成本的同时提供所需性能。
 
合作案例:北京趋势未来科技全面采用“戴尔硬件产品+一站式端到端的技术服务+HPCC管理系统”方案,承建中国灾害性气候高性能运算项目
在具体的合作实践中,北京趋势未来科技与戴尔迅速展开行动,并以科研领域的高性能计算为市场合作重点,全面展开了HPCC系统的推广工作,并赢得了诸多客户的青睐。其中中国科学院大气物理研究所就是双方合作的最具有代表性的案例之一。
2011年初,中国灾害性气候高性能运算项目落户中国科学院大气物理研究所(以下简称“中科院物理所”),为高质高效地完成项目的建设任务,中科院物理所提出了一站式,端到端的方案要求。所谓一站式,就是要求整体方案要在规划、部署、维护三个阶段具有技术支持连贯性;所谓端到端就是要求整体方案要在硬件、软件、网络三个层面具有系统建设整合性。北京趋势未来科技作为项目的承建者,利用戴尔HPCC方案全面满足了客户的上述需求。
 
具体方案如下;
HPCC系统
计算节点采用8片戴尔PowerEdge M910刀片服务器。其硬件配置为:2英特尔®至强® E7-4830处理器,运行频率达2.13GHz24MB缓存,64GB 内存和2146GB SAS硬盘,做RAID1
I/O与管理节点采用1台戴尔PowerEdge R510服务器。其硬件配置为:2英特尔®至强® 5620处理器,12MB缓存, 24GB 内存,2146GB SAS硬盘做RAID1,并采用了Broadcom 5716双端口千兆以太网卡。
 其它方面 第一,计算网络引入了一套40 Gbps Infiniband交换机(32端口);第二,管理网络引入了一套PowerConnect M6220千兆以网络交换机;第三,存储系统引入戴尔MD3000磁盘阵列;第四,所有节点均安装Linux RedHat 操作系统、采用CHESS群集管理软件,硬件系统管理软件采用戴尔Open Manage管理套件。
支持服务
在技术支持与服务方面 北京趋势未来科技联合戴尔为客户提供了三年专业技术支持服务,主要包括如下内容。第一,快速技术响应,确保技术人员在7×24内随时提供远程技术支持,4小时内上门现场故障修复服务;第二,端到端、一站式的全程服务,具体来说,端到端服务是以指定技术经理为单一联络人的统一服务接口负责与英特尔等第三方厂商进行技术协商,协同处理故障的技术服务,一站式服务是指北京趋势未来科技联合戴尔提供全程化的技术支持,包括在调研阶段提供技术咨询服务、在项目规划阶段提供方案设计服务,在实施阶段提供软硬一体的部署服务,在项目后期提供维护和技术培训服务,并可根据客户的需求联合群集系统软件厂商提供集群系统调优,以及脚本文件的定制和开发服务。
“传统的服务器集群内部连接十分复杂,而刀片服务器只需要对机箱背板进行安装和布线就可完成部署,单独的刀片服务器则无需布线。除此之外,刀片服务器还具有非常多的优势,比如易于维护、节省空间、计算密度大、总体拥有成本(TCO)低等,这些都为我们HPCC系统的高效运转奠定了良好的基础。”
——中国灾害性气候高性能运算项目建设负责人
 
在化繁为简方面,利用戴尔的一体化方案,我们的部署时间可以节省90%,维护负担可以减轻至少50%;在开放性方面,戴尔HPCC综合解决方案将自身的计算资源、存储资源,与业内最优秀的HPCC软件、网络系统整合在一起,可以让HPCC系统实现无缝化的系统扩容和异构融合,将HPCC系统的整体生命周期延长至少200%
——中国灾害性气候高性能运算项目建设负责人
 
 
 
合作效益:“戴尔硬件产品+一站式端到端的技术服务+HPCC管理系统”计算群集建设与管理综合解决方案,帮助北京趋势未来科技实现了业务新发展,帮助最终用户实现了HPCC系统应用与管理水平的全面提升
目前,北京趋势未来科技与戴尔在HPCC方面的合作已经逐步走向成熟,且在具体的实践中获益匪浅。北京趋势未来科技IT项目部总经理万征先生介绍说:“通过与戴尔在HPCC方面的合作,我们在业务方面实现了新的发展,首先,公司系统集成项目销售额同比上升了25%;其次,北京趋势未来科技的整体IT项目利润率比以往提高了5%;第三,借助戴尔的品牌优势,我们的项目赢单率都比以往提升了20%,这都是我们与戴尔在HPCC领域联手后取得的收益。未来我们还会在IP SAN虚拟存储、云计算等方面展开更多的合作,相信未来我们北京趋势未来科技会从与戴尔的合作中攫取更大的利益。”
在计算平台方面,由于采用了最新的英特尔®至强®处理器计算平台,使得HPCC在计算综合效能方面拥有了绝佳的品质保障。首先,平台智能化程度更高,英特尔®至强® E7-4830处理器可根据客户的应用需求自动调节功耗;其次,平台运转效率更高,当计算任务需要更强大的处理能力时,HPCC平台可以借助英特尔®睿频加速技术自动提高处理器主频,并利用超线程技术满足复杂计算程序的运行需求,与单核服务器相比,基于该处理器的服务器可获得10多倍的性能提升;第三,平台能耗更低,英特尔®至强® E7-4830采用英特尔®智能节能技术,可自动将CPU和内存调整至低功耗状态,在减少能耗成本的同时提供所需性能。
在具体的实践中,“戴尔硬件产品+一站式端到端的技术服务+HPCC管理系统”计算群集建设与管理综合解决方案,已经得到了广泛的应用,且为最终用户带去了多重利益。首先,在化繁为简方面,利用戴尔的一体化方案,最终用户的部署时间可以节省90%,维护负担可以减轻至少50%;其次,在开放性方面,戴尔HPCC综合解决方案将自身的计算资源、存储资源,与业内最优秀的HPCC软件、网络系统整合在一起,可以让HPCC系统实现无缝化的系统扩容和异构融合,将HPCC系统的整体生命周期延长至少200%;第三,在用户体验方面,戴尔软硬结合,功能齐备、设计科学的HPCC系统,可以让用户实现全面有序化,专业便捷化、持续科学化的群集管理。

 

版权所有:北京趋势未来科技发展有限公司 京公网安备11010802009480号  技术支持:WICEP
收缩