全新的HPE Cray Supercomputing GX5000,搭載HPE Cray Supercomputing Storage Systems K3000儲存系統,將引領AI與HPC融合時代的超級運算突破
HPE(NYSE:HPE)宣布獲選為美國能源部(DOE)的橡樹嶺國家實驗室(Oak Ridge National Laboratory, ORNL)建造兩套超級運算系統,旨在推進美國於 AI 與超級運算領域的領導地位,並支援科學、能源和國家安全發展。
此兩套系統包括次世代的百萬兆級(Exascale)超級電腦「Discovery」,其將接替該實驗室的 Frontier(由 HPE 建造並突破百萬兆級運算門檻的超級電腦);以及一個新的 AI 叢集「Lux」系統,該叢集將透過多租戶(multi-tenant)雲端化平台,協助美國能源部推進 AI 與機器學習的計畫。

Discovery 將採用全新的 HPE Cray Supercomputing GX5000,此為 HPE 針對領導級系統推出的次世代超級運算平台,利用統一的 AI 與高效能運算(HPC)架構簡化全站點和分散式叢集的運作。其將搭載內嵌分散式非同步物件儲存(Distributed Asynchronous Object Storage, DAOS)的全新 HPE Cray Supercomputing Storage Systems K3000(作為 HPE Cray Supercomputing GX5000 的選配儲存系統)進行增強。Discovery 將為 AI、高效能運算與量子運算提供全新功能,預計可將特定應用程式的生產力提高十倍1,協助科學家加速在精準醫療、癌症研究、核能和航太等領域取得突破。
「當我們為橡樹嶺國家實驗室建造 Frontier 並開啟百萬兆級運算的時代,我們即達成了超級運算歷史上的巔峰,也是美國的一大勝利,」HPE 總裁暨執行長 Antonio Neri 表示。「我們很榮幸能憑藉此一領導創新技術,持續與美國能源部、橡樹嶺國家實驗室和 AMD 建立強大的公私夥伴關係,透過打造 Discovery 和 Lux 系統,加速推動科學探索和 AI 創新的下一個時代。」
Lux 是一套專用的 AI 系統,採用直接液冷式(direct liquid-cooled)的 HPE ProLiant Compute XD685,並搭載 AMD Instinct MI355X GPU、AMD EPYC™ CPU 與 AMD Pensando™ 網路。Lux 旨在增強對 AI 資源的存取,為全美研究人員提供雲端般的存取權限,能連接至專為訓練與推論配備資源的主權 AI 工廠(sovereign AI factory)。
Discovery 則進一步提升 HPE Frontier 超級電腦的百萬兆級運算能力。其將協助該實驗室在各個科學領域開創新視野,同時推動創新與安全使命。
「我們期待 Discovery 和 Lux 系統能協助實驗室研究人員擴展科學研究,」橡樹嶺領導運算中心(Oak Ridge Leadership Computing Facility)科學總監 Bronson Messer 表示。「Discovery 將為高效能運算、AI 與量子運算融合能力的新境界奠定基礎,並結合其他系統提供更深入的洞察,而 Lux 將大幅擴展研究人員對專用AI資源的存取。我們預期這兩套系統將有助於生產力的典範轉移(paradigm shift),並在各個關鍵的科學研究和領導領域達到前所未有的成果。」
「過去十多年,AMD 與 HPE 持續攜手突破高效能運算的極限,提供能探索並改變世界的解決方案,」AMD 董事長暨執行長蘇姿丰博士(Dr. Lisa Su)表示。「我們與橡樹嶺國家實驗室攜手合作,透過 Discovery 和 Lux 推進次世代 AI 系統的發展,賦能研究人員加速創新,並鞏固美國在科學與技術領域的領導地位。」

深入了解次世代百萬兆級的超級電腦Discovery
Discovery 的技術突破源於 HPE 全新推出的 HPE Cray Supercomputing GX5000。HPE 延續自 1975 年發布 Cray-1 超級電腦以來長達 50 年的創新技術,為 AI 與高效能運算的融合時代打造次世代的超級運算基礎架構。
HPE Cray Supercomputing GX5000 專為百萬兆級運算打造,在 CPU、GPU、加速器、網路、軟體、儲存與液冷方面,皆具備先進的端到端能力。透過全新架構,Discovery 將提供:
● 更高效能與最佳化空間:此新平台專為擴展至百萬兆級效能所打造。相較於上一代2,具有更高密度,每機櫃所需的資料中心空間減少 25%。
●HPE Slingshot提供高效能互連(Interconnect):次世代 HPE Slingshot 為 Discovery 提供現代化且高效能的互連網路。
● 業界首創的HPC DAOS儲存效能3:藉由全新的 HPE Cray Supercomputing Storage Systems K3000,Discovery 每個儲存機架的每秒輸入/輸出操作數(IOPS)與 Frontier 相比將增加 300%4,使 AI 應用程式能以更高生產力運行。HPE Cray Supercomputing Storage Systems K3000 為業界首個內嵌分散式非同步物件儲存(DAOS)開源軟體的原廠建置(factory-built)儲存系統,其為一款具備成本效益的全快閃(all-flash)儲存系統,能與同樣搭載於 Discovery 的 Lustre 檔案系統 HPE Cray Supercomputing Storage Systems E2000 互補。
● 次世代液冷加速運算:Discovery 將搭載代號為「Venice」的次世代 AMD EPYC 處理器與 AMD Instinct MI430X GPU,為建模、模擬和 AI 專案提供進階的效能及準確性。憑藉 HPE 在液冷領域長達 50 年創新的經驗5,Discovery 運算基礎架構將採用完全液冷技術,以最佳化超級運算環境中的能源效率與成本效益。
HPE 作為全球超級運算6的領導者,透過頂尖的 AI 和高效能運算專業技術,為客戶提供端到端的解決方案與服務。HPE 的超級運算服務透過統一的基礎架構與應用程式管理,協助企業改善成果,並專注於核心業務需求和持續創新。
1 與橡樹嶺國家實驗室前一代超級電腦Frontier相比的應用程式效能。
2 GX5000單一900毫米機櫃的尺寸與EX4000的1,200毫米機櫃相比。
3 基於DAOS的儲存系統於全球IO500儲存基準測試中名列第1與第2位,且其合計的儲存基準分數是排在其後30個儲存系統總和的四倍。
4 部署於Frontier超級電腦的Cray ClusterStor E1000儲存系統,每個儲存機櫃能提供高達1,800萬次IOPS(每秒輸入/輸出操作),而部署於Discovery超級電腦的 HPE Cray Supercomputing Storage Systems K3000則能提供高達7,500萬次 IOPS。
5 Cray-1超級電腦於1975年推出。
6 資料來源:Hyperion Research 2023年第四季HPC市場數據報告(2024 年 5 月 29 日發布),涵蓋2023年超級電腦市場區段。
