解決方案

以客戶為(wèi)中(zhōng)心,提供定制化或一站式的全棧解決方案,賦能(néng)千行百業

寶德(dé)CAE高性能(néng)解決方案
概述

CAE即計算機輔助工(gōng)程設計,是以現代計算力學(xué)為(wèi)基礎,以計算機仿真算力為(wèi)手段的工(gōng)程分(fēn)析技(jì )術,是實現産(chǎn)品優化設計的主要支持模塊。目前在航空、航天、能(néng)源動力等工(gōng)業領域,利用(yòng)CAE進行反複設計、分(fēn)析、優化已成為(wèi)标準的必經步驟和手段,不同的CAE應用(yòng)程序對硬件資源例如處理(lǐ)器、網絡和存儲的要求各不相同。寶德(dé)針對CAE高性能(néng)計算平台的需求和挑戰,提出了CAE高性能(néng)的主要解決方案。



項目背景

目前,在航空、航天、能(néng)源動力等工(gōng)業領域,利用(yòng) CAE 在 HPC 集群上進行反複 設計、分(fēn)析、優化已成為(wèi)标準的必經步驟和手段,不同的 CAE 應用(yòng)程序對硬件資源例如處理(lǐ)器、網絡和存儲的要求各不相同,并需要投入大量的資源進行選擇、部署和維護。對于在 CAE 領域部署難、選型難、維護難等問題,寶德(dé)推出了面向 CAE的 HPC 解決方案,在簡化 HPC 集群部署的同時,提供高度的靈活性、可(kě)擴展性和高性能(néng),為(wèi) CAE 領域的發展加油助力。





方案配置

硬件方面,寶德(dé) CAE 高性能(néng)計算解決方案的計算節點通 過标準開放的高速網絡實現互聯,運行開源 Linux系統,提供單一系統接口到外面。它是為(wèi)大規模科(kē)學(xué)并行計算而 設計的。兼具(jù)事務(wù)處理(lǐ)和網絡信息服務(wù)。

軟件方面,寶德(dé)集群系統配置豐富的軟件系統,包括操作(zuò)系統、編譯器、調試器、函數庫、并行通信庫、全局共享 并行文(wén)件系統等基礎軟件。


1. 計算節點

寶德(dé)PR2715W是基于第三代英特爾® 至強® 可(kě)擴展處理(lǐ)器打造出的一款2U服務(wù)器産(chǎn)品,它采用(yòng)Intel C620系列高性能(néng)芯片組,最大支持2顆第三代英特爾® 至強® 可(kě)擴展處理(lǐ)器。同時PCIE升級為(wèi)4.0,大大提搞了CPU與PCIE設備的通信能(néng)力。PR2715W整體(tǐ)性能(néng)比上一代産(chǎn)品提升多(duō)至40%,更高的處理(lǐ)器TDP,更強的硬件安(ān)全能(néng)力,而且具(jù)備更出色的能(néng)源效率。


2. GPU加速節點

GPU節點采用(yòng)寶德(dé)PR4910W,該産(chǎn)品是寶德(dé)公(gōng)司最新(xīn)推出的一款基于第三代英特爾® 至強® 可(kě)擴展處理(lǐ)器的4U雙路機架式加速計算服務(wù)器。該機型擁有(yǒu)32個DDR4 DIMM插槽并最多(duō)支8TB内存容量;擁有(yǒu)10個全高全長(cháng)雙寬的GPU插槽,并另提供2個PCIe 4.0 x16插槽,1個OCP網卡插槽。為(wèi)應用(yòng)軟件的加速提供了助力,實現CAE效率的快速提升。


3. 分(fēn)布式存儲系統

為(wèi)了應對多(duō)數CAE軟件并行擴展性好、算例數據量大的特點,寶德(dé)高性能(néng)集群配置了PL-XDFS分(fēn)布式并行存儲系統。寶德(dé)推出的PL-XDFS支持海量數據,在線(xiàn)擴容,存儲容量和聚合帶寬同步提升,滿足了高通量計算對存儲系統的需求。


4. 高速網絡交換

集群配備了高帶寬低延遲的Infiniband高速網絡,滿足了應用(yòng)軟件中(zhōng)各類MPI程序數據交換需求,提高了多(duō)節點之間的并行效率,加快模拟計算過程。


5. 軟件系統

寶德(dé)Powercloud集群管理(lǐ)和作(zuò)業調度系統,實現設計、仿真平台的統一門戶,一體(tǐ)化管理(lǐ),監控管理(lǐ)和作(zuò)業調度。


6. 編譯器方面

支持Fortran77/Fortran95/C/C++等,并支持OpenMP 以及MPI 程序編譯。此外,我們還提供并行程序調試及調優工(gōng)具(jù),以幫助用(yòng)戶更好的完成程序開發。寶德(dé)高性能(néng)集群系統配置豐富的數學(xué)函數庫和并行環境供用(yòng)戶選用(yòng),包括Goto、Lapack、FFTW、MPICH 等。


解決方案

寶德(dé) CAE 高性能(néng)計算解決方案為(wèi)集群架構,采用(yòng)基于第三代英特爾® 至強® 可(kě)擴展處理(lǐ)器打造的寶德(dé)全新(xīn)一代服務(wù)器PR2715W為(wèi)計算節點,以及PR4010W為(wèi)GPU加速平台。所有(yǒu)硬件和軟件都部署在系統中(zhōng),以打造實現高效并行、協同仿真、數據安(ān)全共享一體(tǐ)化。



寶德(dé)高性能(néng)集群服務(wù)器均采用(yòng)X86-64平台,屬同構系統,可(kě)共享軟件資源和數據存儲空間,資源調度簡單,節點配比可(kě)靈活調整,适應各種應用(yòng)需求,能(néng)夠有(yǒu)效降低用(yòng)戶的 總體(tǐ)擁有(yǒu)成本。

方案優勢
  • 高計算性能(néng)

    計算資源豐富,滿足 CAE 應用(yòng)各種需求,提供合适的環境。還采用(yòng)了英特爾密碼操作(zuò)硬件加速技(jì )術來減少加密計算對于性能(néng)的影響,保證資源的高效利用(yòng)。

  • 高通信能(néng)力

    該方案采用(yòng)高帶寬低延遲的 InfiniBand 作(zuò)為(wèi)通信網絡來提升節點間的通信能(néng)力,大大降低了通信延遲。并且通 過 IB 交換機實現所有(yǒu)計算節點的全互聯。

  • 高可(kě)靠性

    整套集群采用(yòng)多(duō)種可(kě)靠性設計方案大幅度提升系統的可(kě)靠性,确保系統無單點故障。

  • 高擴展性

    能(néng)根據用(yòng)戶需求靈活對現有(yǒu)計算資源和存儲空間進行擴展。

  • 高安(ān)全性

    首次引入了 SGX 英特爾® 軟件防護擴展技(jì )術,提供可(kě)信的執行環境。以及英特爾® 平台固件彈性技(jì )術為(wèi)BIOS閃存、BMC閃存、英特爾管理(lǐ)引擎和電(diàn)源固件提供保護,防止外部攻擊。還有(yǒu)英特爾® 全内存加密,可(kě)确保從CPU訪問的所有(yǒu)内存都是加密的,保障用(yòng)戶憑據等敏感信息不會被竊取。