18244236404

高性能计算服务器_联想面向未来的 HPC 战略背后是什么?

Admin 442 2021-10-04 15:55

成都服务器总代理_2014 年标志着联想在高性能计算 (HPC) 领域迅速崛起的开始。从世界上最强大的超级计算机 500 强排名中的零系统到 2018 年领先的系统份额,再到今天保持第一的位置,该公司的崛起简直就是奇迹。


联想快速攀升至 HPC 领导地位的秘诀是什么?“当联想在 2014 年收购 IBM x86 计算集团时,我们看到多个独特的元素融合在一起。IBM 深厚的技术经验以及对合作伙伴关系的承诺,”联想 HPC 和 AI 副总裁 Scott Tease 说。


“所有这一切都与联想的 DNA 相结合:拥有自己的供应链、我们的规模优势和执行速度。” 他说,这不仅适用于大型超级计算站点,还适用于他们的整体数据中心业务,而不仅仅是服务器。该公司的存储、软件和服务业务也一直处于亏损状态。


成都服务器总代理_在 HPC 方面,Tease 非常了解在商业、学术和公共部门领域发展复杂业务所需的条件。联想收购的 IBM x86 业务是由他自己的团队组成,他曾在 IBM 担任该部门的经理十多年。同样重要的是,当谈到 HPC 现在和未来十年的需求时,他看到了墙上的文字。这一切都始于将百亿亿次驱动的技术引入每个 HPC 商店。


这种“从 Exascale 到 Every Scale”的概念意味着最大的银行和国家实验室拥有的相同高端技术构建块可以是完全相同的单节点或小型集群客户可以部署的。“这是一项工程承诺,允许任何客户轻松集成最大规模使用的相同 HPC 技术。我们的目标是确保这些构建块经过精心设计,以便无论您的中心有多大或多小,即使您购买的是单个机架,您也可以在大型安装中使用相同的技术。”


成都服务器总代理_除了专注于准备好以任何规模部署的高端技术的构建块之外,Tease 表示,墙上的另一部分文字正在使所有这些功能变得高效。这不仅仅是能耗数据。由于 HPC 系统需要更高的密度,这意味着它们将产生更多热量——以至于传统的风冷散热方法将不再适用。


联想保持其作为 500 强 HPC 系统顶级供应商地位的面向未来的过程的一部分是继续其在新型冷却技术方面的领先地位。这项工作的核心是联想 Neptune 冷却系统,该系统在超密集外壳中采用直接温水冷却,可以满足 HPC 的密度需求,而不会出现过热元件,从而导致性能下降和停机。

高端积木

联想的一些有远见的客户也看到了墙上的文字——事实证明,全部都是大写字母。Simon Thompson 是英国伯明翰大学计算资源背后的硬件架构策划者之一。他说,他和 Tease 一样预计,对高端构建模块的需求以及对效率的关注日益增加。然而,在 2014 年,这意味着要承担一些风险,无论是评估将水引入数据中心,还是后来的 500 强级资源,这些资源可以随着时间的推移无缝地拼凑在一起。


与许多大学 HPC 中心必须在同一硬件上进行广泛多样的研究一样,伯明翰大学对新硬件采购采取“即建即用”的方法。Thompson 表示,这样做的优势包括能够在新技术(加速器、新处理器等)到来时采用它们,通过单个集群购买在经济上避免“哎哟”因素,并且可以灵活地通过正确的方式满足用户需求。硬件而不是通用资源。


他补充说,使用 EasyBuild 和其他工具,管理这些添加内容不再是一件耗时的麻烦事,大部分过程都是自动化的。有了所有这些灵活性,最大的问题就变成了将性能保持在最佳状态并有效地管理电源和冷却成本。


成都服务器总代理_Thompson 和他的团队是最早研究新型冷却技术的人之一。2014 年,他们研究了浸入式冷却以及其他空气替代方案。与此同时,联想开始在其从 IBM 继承的液冷产品的基础上构建,超越直接水冷 NeXtScale 机箱。


2018 年,随着联想 Neptune 品牌的水冷系统的推出,联想确立了自己作为液冷行业领导者的地位,液冷系统与风冷系统一样易于安装、操作和服务 - 沉浸感竞争对手无法保证他们对联想服务器排水、防滑垫和专业处理的要求。


到 2021 年,联想发布了第五代联想 Neptune 液冷技术,Thompson 解释说,这种能力正好符合 HPC 的发展方向:超高密度计算,配备耗电 CPU、GPU 和更大内存,高级网络都与可扩展性挂钩存储系统。


该大学最新的集群基于英特尔至强“Ice Lake”处理器、Nvidia A100 GPU,所有这些计算能力足以在峰值性能方面跻身前 200 名超级计算机之列,仅在两个机架中进行处理。


成都服务器总代理_Thompson 说:“我们正处于这样一个阶段,HPC 无法在没有液体冷却的情况下部署这样的系统。”

“过去的独特之处现在已成为常态,”Tease 表示同意。“过去,拥有 250 或 350W GPU 和 240W CPU 是个例外——现在它们已成为常态,而且还在不断增加。每个人都将不得不计划如何减轻热量和处理电力输送。我们需要考虑的是数据中心应该如何工作,我们如何提供电力和冷却,以及这对人们使用新技术保持路线图的能力意味着什么。”


虽然 Thompson 在英国的团队的规模和规模远不及联想的一些最大的超级计算客户(德国的 LRZ、韩国的 KMA)及其联想 Neptune 液冷系统,但他们的故事证明了 Tease 的“从 Exascale 到各种规模”的概念。” 伯明翰大学的研究人员现在可以使用相同的高端节点和机架级技术,这些技术为联想的一些最大的装置提供支持。


Thompson 表示,去年他们能够从用户那里接收更多的应用程序,从数据中心的角度来看,他们节省了 40% 的风冷设施所需的费用。此外,n1200 机箱中的超密集联想 Neptune 节点意味着空间受限的中心的占地面积要小得多。


“功率越高,热量输出越高,液体冷却变得越有趣,”Tease 说。他补充说,多年来开始的实验正在转变为液体冷却革命,从电力成本通常较高的欧洲站点转移到中国、亚洲、澳大利亚和北美以及更多欧洲站点。除了冷却系统的性能优势(可以更频繁和更长时间地在涡轮模式下运行,避免因热量而导致的故障等)


戏弄增加了另一个好处——一个不太明显的好处。“保持系统凉爽的成本降低 40% 不需要直接影响底线。它可以回收到其他绿色环保的数据中心项目中。”


伯明翰大学是迄今为止联想 HPC 战略的生动证明:专注于构建可扩展的技术,无论部署的集群规模如何,强调峰值性能和高密度,并且可以在艺术冷却。


“在联想,我们很自豪能够从 2014 年的零上升到世界领先的 Top500 超级计算机供应商,”Tease 说。“比系统数量更重要的是,与其他任何供应商相比,我们正在更多的国家和更多的研究人员手中部署超级计算机。我们相信,将更智能的技术交到世界各地的研究人员手中将有助于解决人类面临的一些最大挑战,并使未来成为更美好的生活场所。”


【公司名称】四川旭辉星创科技有限公司

【代理级别】成都联想服务器工作站总代理

【销售经理】熊经理

【联系方式】座机:028-85596747    手机:18244236404

【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913

联系我们
您好,咨询客服了解更多促销产品
售前优惠在线咨询
QQ咨询
微信咨询
售前优惠电话咨询专线:
18244236404
售后电话咨询专线:
028-85596747

请用微信扫描二维码

3.524919s