本次合作為Meta AI發展背後的Agentic工作負載提供強大支援
Meta 與 AWS 宣布雙方簽署協議,Meta 將大規模部署 AWS Graviton 處理器,代表兩家公司長期合作夥伴關係的重大進展,以支援 Meta 新一代 AI 系統建設。
本次部署初期規模達數千萬個 Graviton 核心,並可隨 Meta AI 發展需要持續擴展。本次合作亦反映AI基建架構正在轉變:雖然 GPU 仍主要用於大型模型訓練,但隨著 Agentic AI 應用增加,CPU 密集型工作負載(包括即時推理、程式碼生成、搜尋及多步驟任務協調)的需求亦大幅上升。Graviton 主要針對此類工作負載設計,為 Meta 提供大規模高效運行所需的處理能力。
這些晶片將支援 Meta 多種工作負載的運算需求,包括該公司的AI發展。相關工作需要能夠處理數十億次互動的基礎設施,同時協調複雜的多步驟 Agentic 工作流程——這正是 Graviton 所擅長的 CPU 密集型運算。

AWS Graviton晶片驅動AI工作負載
隨著愈來愈多機構採用 Agentic AI——即能夠自主推理、規劃和完成複雜任務的系統——市場對高效能、節能運算基礎設施的需求亦前所未有地增長。Meta 處於 Agentic AI 發展的尖端,其大規模部署 Graviton 反映一個簡單的事實:Agentic 工作負載(如程式碼生成、即時推理和前瞻模型訓練)均屬 CPU 密集型運算,而專門設計的晶片是驅動這些工作負載最高效的方式。
Graviton5 晶片配備 192 個核心,其快取記憶體容量為上一代的五倍,核心之間的通訊延遲最高可減少達 33%。這意味著更快速的資料處理和更大的頻寬——對於需要持續推理並執行多步驟任務的 Agentic AI 系統而言,這些都是關鍵需求。
Graviton 以 AWS Nitro System 為基礎,利用專屬硬體和軟體實現高效能、高可用性和高安全性。Nitro System 支援裸機執行個體,讓用戶直接存取硬體,同時提供一致的 Elastic Network Adapter(ENA)和Amazon Elastic Block Store(Amazon EBS)裝置,使 Meta 能夠在不影響效能的情況下運行自身的虛擬機器。
Graviton5 執行個體系列亦支援 Elastic Fabric Adapter(EFA),實現執行個體之間的低延遲、高頻寬通訊。這對 Meta 的 Agentic AI 工作負載非常重要——大規模任務需要分配到眾多處理器上協調運作。
作為AWS的長期客戶,Meta 仰賴 AWS 高度可擴展且安全的雲端基礎設施來支援其全球業務。
Amazon 副總裁兼傑出工程師 Nafea Bshara 表示:「這不僅僅關乎晶片,更是為客戶提供基礎設施根基,以及資料和推論服務,以建構能夠理解、預測並高效擴展至全球數十億用戶的 AI。Meta 擴大合作,部署數千萬個 Graviton 核心,展示當專門設計的晶片與完整的 AWS AI 技術堆疊相結合,如何驅動新一代 Agentic AI。」
Meta 基礎設施主管 Santosh Janardhan 表示:「隨著我們擴展 Meta AI 願景背後的基礎設施,多元化運算資源是一項策略要務。AWS 多年來一直是我們值得信賴的雲端合作夥伴,擴展至 Graviton 讓我們能夠以所需的效能和效率,大規模運行 Agentic AI 背後的 CPU 密集型工作負載。」
Graviton的節能優勢
AWS Graviton5 採用 3 奈米晶片技術——這種製造工藝能夠生產更小型、更高效能的處理器。由於 AWS 從零開始設計晶片,並全面掌控從晶片設計到伺服器架構的完整流程,因此能夠以現成處理器無法比擬的方式最佳化效能與能源效率。
最終成果是在提供更高效能的同時,保持領先的能源效率,協助 Meta 在追求宏大 AI 目標的同時,持續推進永續發展目標。Graviton5 的效能較上一代提升高達 25%。
隨著所有產業對 AI 運算的需求持續增加,底層基礎設施的效率變得愈加重要——無論是在管理成本還是減少環境影響方面。
本次合作代表大規模 AI 基礎設施建設方式的新篇章——以及像 Graviton 這樣的專門設計晶片如何協助 Meta 等企業,為全球數十億用戶提供更智慧、更客製化的體驗。
進一步了解 AWS如何研發自研晶片,以驅動新一代 AI。
如欲了解更多有關 AWS Graviton5 的詳情,請瀏覽:
