最新Top500排行榜中,搭載AMD核心的超級電腦數量年增39%至140台;AMD現為全球10大最具能源效率超級電腦的其中8台挹注效能
AMD(NASDAQ: AMD)在 2023 年超級運算大會(Supercomputing 2023,SC23)上展現在高效能運算(HPC)持續領先的地位。AMD EPYC™處理器與 AMD Instinct™加速器持續成為全球最創新、最具能源效率以及最快超級電腦的解決方案首選。在最新Top500全球超級電腦排行榜中,AMD 為其中 140 台超級電腦挹注效能,年增率高達 39%。此外,在最新出爐的 Green500排行榜中,全球前 10 大最具能源效率超級電腦中有8台搭載 AMD 核心。
AMD 執行副總裁暨資料中心解決方案事業群總經理 Forrest Norrod 表示,AMD 技術持續擔綱先鋒,解決全球最重要的挑戰。我們與全球的國家實驗室與研究機構攜手合作,加速科學探索,並在醫療、能源以及物理等關鍵領域推動更深層的探索與認知。我們與產業合作,協助建立與推動全新的效能與能源效率典範,讓全球科學家與研究人員拓展突破性成果,攻克人類最艱鉅的難題。
AMD領航Exascale等級時代
橡樹嶺國家實驗室(ORNL)的 Frontier 超級電腦搭載 AMD EPYC 處理器與 AMD Instinct 加速器,連續四屆蟬聯全球最快電腦榜首。Frontier 結合最佳效能與領先的能源效率,在其第一年的運行期間,持續推動高度影響力的科學研究。基於 Frontier 的最新科學專案包括電網最佳化的全新研究、具備更優異效率與功能的飛機引擎設計、以及戈登貝爾獎(Gordon Bell award)六個決賽名額的其中兩個。
第二台採用 AMD 核心的 Exascale 等級超級電腦 El Capitan 已在美國勞倫斯利佛摩國家實驗室(Lawrence Livermore National Laboratory,LLNL)開始組建。此系統搭載即將推出的 AMD Instinct MI300A APU,其為首款將CPU與GPU核心以及高頻寬記憶體統一封裝的資料中心 APU。這項創新設計將帶來大幅提升的能源效率與效能。在 El Capitan 上線執行後,預計將提供超越 2 exaflops 的雙精度效能,成為第二台部搭載 AMD 核心且跨過 exaflop 門檻的超級電腦。欲了解更多關於 El Capitan 的資訊,請瀏覽美國勞倫斯利佛摩國家實驗室的影片。
美國勞倫斯利佛摩國家實驗室利佛摩運算技術長 Bronis R. de Supinski 表示,我們組建 El Capitan 的進展非常順利,此超級電腦顯然將成為全球最頂尖的運算系統之一。多位合作夥伴投入極大心力合作創建的系統將讓科學家化夢想為成果。El Capitan 將提供令人讚嘆的可程式化能力、效能以及能源效率,憑藉 AMD Instinct MI300A APU 消弭 CPU 與 GPU 之間頻繁移動資料衍生的諸多難題,協助我們完成任務。
達到更具能源效率的運算
能源效率在 HPC 領域是業界的最優先要務,藉以實踐永續發展的承諾,以及藉由效能造就出新一代的超級電腦。AMD 正在開創創新途徑,以 30×25 目標加速能源效率,目標在 2025 年之前讓 AI 訓練與 HPC 處理器與加速器的能源效率相較 2020 年基準提升 30 倍註1,並透過全方位的晶片設計與系統層級升級來達成這項目標註2。
AMD 在最新 Green500 排行榜前 10 大系統中搶下 8 席,包括前 2 大最強勁的超級電腦 Frontier 與Adastra,充分展現 AMD EPYC 處理器與 AMD Instinct 加速器在能源效率功能上發揮的影響力。
AI與HPC融合
AMD 亦提供硬體與軟體產品組合,因應 HPC 產業對 AI 應用快速成長的需求。
AMD Instinct 加速器與 AMD EPYC 處理器在最新出爐的 HPL-MxP Mixed-Precision Benchmark 中為前兩大系統 Frontier 與 LUMI 挹注效能,凸顯 HPC 與 AI 工作負載融合的運算效能。整體來看,基於 AMD 的系統為排行榜頂尖席位中的顯著贏家,Frontier 在 HPL-MxP 中達到 9.95 exaflops,LUMI 系統則達到 2.35 exaflops,展現 AMD EPYC CPU 與 AMD Instinct 加速器在 AI 工作負載的持續成長與功能。
在軟體方面,AMD 與 AI 及 HPC 社群持續推動開放軟體產業體系,透過開放軟體合力支援全新應用、框架以及程式語言等。AMD ROCm™開放軟體平台持續發展,獲得許多大規模 HPC 與 AI 系統採用。ROCm 軟體堆疊亦為 PyTorch 2.0 提供 Day-0 支援,為開發人員提供由 PyTorch 支援之廣泛 AI 模型陣列,不僅與 AMD 加速器相容,且裝機後立即可用。
AMD Instinct MI300A解決方案合作夥伴
HPE 近期發表 HPE Cray Supercomputing EX255a accelerator blade,搭載 AMD Instinct MI300A APU。MI300A APU 將成為全球首款支援 AI 與 HPC 的 APU 加速器,極其適合用於 AI 與 HPC 工作負載。
此外,法國 HPC 與 AI 機構 GENCI 將參與採用 AMD Instinct MI300A 加速器之 Adastra 超級電腦的首次擴充。這款未來搭載 AMD 的主機將為法國研究人員在 HPC 與 AI 應用融合方面提供支援。
Eviden 近期為 BullSequana XH3000 的完整 DLC 超級電腦產品線開發出搭載 AMD Instinct MI300A 的刀鋒型主機,並將為德國馬克斯普朗克資料機構(Max Planck Data Facility,MPCDF)的 H1-24 提供首台搭載AMD Instinct MI300A 的超級電腦。
註1:包括AMD高效能CPU與GPU加速器,在4個加速器/CPU上執行的受測系統組態中執行AI訓練與高效能運算。目標運算是根據標準效能指標執行的效能跑分(HPC:Linpack DGEMM kernel FLOPS設定為4k維度矩陣。AI訓練:較低精準度的訓練浮點運算GEMM數學核心,包括以4k矩陣維度進行FP16或BF16 FLOPS的運算),再除以代表加速運算節點的能耗,包括CPU主控端加上記憶體與4個GPU加速器的耗電。
註2:EPYC-030a:運算包括1:2025年的基準kWhr耗電預測,由Koomey Analytics根據現有的研究與資料,包括特定領域2025年預測部署量以及資料中心耗電效率(PUE),包含GPU HPC與機器學習(ML)安裝系統,以及2:AMD CPU與GPU節點的耗能,包括特定領域的使用率(執行與待機)比例,並乘以PUE,推算出實際總耗能,用來運算每瓦效能資料。13.5倍的運算是使用以下公式(針對2025年預測的基準HPC節點kWhr資訊,乘以運用DGEMM與TEC推算出的AMD 2023年每瓦效能改進,加上預測2025年基準機器學習節點kWhr耗電預測乘以使用機器學習數學與TEC運算測得AMD 2023年每瓦效能改進幅度)/(2020年每瓦效能資訊,乘以2025年基準預測kWhr耗能)。欲瞭解詳細資訊,敬請參閱:www.amd.com/en/corporate-responsibility/data-center-sustainability。