英特爾推出針對推論最佳化、代號為「Crescent Island」的資料中心GPU,並公佈Gaudi 3機架級參考設計
英特爾首席技術長 Sachin Katti 表示:「AI 正從靜態訓練轉向即時且無所不在的推論運算,而這股轉變正由『代理式 AI(agentic AI)』所驅動。為有效擴展這類複雜的工作負載,需要能讓不同晶片各展所長的異質系統,並以開放的軟體堆疊為基礎。英特爾採用 Xe 架構的資料中心 GPU,將為客戶提供更高效能的運算空間與更高價值,以因應推論運算量的急速成長。」

重要意義
隨著推論成為 AI 的主要工作負載,成功的關鍵已不僅僅是強大的晶片,而是系統層級的創新。從硬體到調度管理,AI 推論需要以工作負載為核心、開放且靈活的架構,能整合多元的運算形式,並以開放、以開發者為中心的軟體堆疊,打造易於布署與擴展的系統。
英特爾在端到端解決方案方面具備獨特優勢,從 AI PC 到資料中心與工業邊緣,解決方案基於 Intel Xeon 6 處理器、Intel Gaudi 3 和 Intel GPU,具備 PCIe 靈活性與機架級設計,降低企業與雲端服務商的布署障礙。
透過針對效能、能源效率與開發者延續性的協同設計,並與 Open Compute Project(OCP)等社群合作,英特爾讓 AI 推論能在最需要的地方無所不在地運行。
關於GPU
全新代號「Crescent Island」的英特爾資料中心 GPU,針對氣冷式的企業級伺服器進行功耗與成本最佳化設計,並具備大量記憶體容量與頻寬,專為 AI 推論工作流程而打造。
主要特色包括:
- ● 採用 Xe3P 微架構,提供最佳化的效能與功耗比。
- ● 配備 160GB LPDDR5X 記憶體。
- ● 支援多種資料類型,非常適合「Token-as-a-Service」供應商與各類推論應用場景。
英特爾針對異質 AI 系統打造的開放且統一的軟體堆疊,目前正於 Arc Pro B 系列 GPU 上進行開發與測試,以便提前進行最佳化與版本迭代。代號為 Crescent Island 的新款資料中心 GPU,預計將於 2026 年下半年開始提供客戶樣品。

Gaudi 3彈性化的大規模AI推論
Gaudi 3 支援從 PCIe 到機架級(rack-scale)的靈活布署,讓客戶能夠從既有基礎架構擴展至完整機架等級的推論效能。新的參考設計支援每個機架最多 64 個加速器,配備 8.2 TB 高頻寬記憶體與液冷系統,針對大型模型與即時推論進行最佳化。