● NVIDIA 發布高效能、高能源效率的 NVIDIA Vera CPU,旨在驅動各產業的多種工作負載,包括代理型 AI、強化學習和資料處理。
● Vera CPU 可驅動獨立的 Vera 伺服器、NVIDIA Vera Rubin 系統和 Vera BlueField-4 STX AI 儲存平台。
● 計畫採用 Vera CPU 改造其 AI 工廠的全球 AI 實驗室包括 Anthropic 和 SpaceXAI,以及超大規模資料中心營運商字節跳動、CoreWeave 和 Oracle Cloud Infrastructure。
● 大規模生產獨立 Vera CPU 系統的製造商包括戴爾科技集團、慧與科技、聯想和美超微,以及華碩、仁寶電腦、鴻海科技集團、技嘉科技、和碩聯合科技、雲達科技、緯創和緯穎。

NVIDIA 今日宣布全球領先的科技公司計劃採用 NVIDIA Vera,這是首款專為人工智慧(AI)代理而設計的 CPU。
NVIDIA Vera 現已全面量產,作為新一代處理器,其任務完成速度比 x86 CPU 快 1.8 倍,可驅動各產業的多種工作負載,包括代理型 AI、強化學習和資料處理,為資料中心創造更多詞元營收。
代理型 AI 正在推動全球 CPU 市場的擴張,該市場每年的基礎設施支出已接近 2,000 億美元。 Vera 將 NVIDIA Vera Rubin 平台從 GPU 擴展到 CPU,為客戶提供了一個統一的基礎架構,用於執行訓練、推理和代理型 AI 應用。
以 NVIDIA Grace™ CPU 的成功為基礎,迄今出貨量已近 250 萬,Vera 將 CPU 效能與能源效率提升至全新高度,專為現代資料中心中最嚴苛的 AI 工作負載而設計。在這樣的環境中,AI 代理已從回答基本問題,進化為能夠執行操作、運行程式碼、使用工具並評估結果。
目前探索採用 Vera CPU 的客戶涵蓋金融領域領導者紐約證券交易所、全球 AI 實驗室 Anthropic、OpenAI 與 SpaceXAI,以及超大規模雲端業者字節跳動、CoreWeave、Lambda、Nebius、Nscale 與 Oracle Cloud Infrastructure(OCI)。Vera 亦正整合至全球頂尖系統製造商的 AI 基礎架構中,包括戴爾科技集團、慧與科技、聯想集團與美超微,以及台灣系統製造商。
NVIDIA 創辦人暨執行長黃仁勳表示:「AI 代理將成為最龐大的運算資源使用者。Vera 是第一款專為此未來而設計的 CPU,旨在以卓越的效能、效率與可程式化,在超大規模環境中運行代理型 AI。」
紐約證券交易所集團總裁 Lynn Martin 表示:「紐約證券交易所的核心目標,在於最佳化支撐我們無可匹敵基礎架構之系統的延遲、吞吐量與可靠性。紐約證券交易所每日處理逾 1.1 兆則訊息。透過與 Redpanda 及慧與科技的合作,並採用 NVIDIA Vera CPU,我們將在擴充容量的同時進一步優化延遲,以驅動高效能、高韌性且具備 AI 就緒能力的市場基礎架構。」
Claude 背後的 AI 創新公司 Anthropic,正評估導入 Vera 以擴展 CPU 密集型代理型工作負載。
Anthropic 運算負責人 James Bradbury 表示:「擴展運算資源是推動模型成長的重要加速器。我們很高興看到 Vera 在解決代理型工作負載時,展現出成為生態系重要一環的潛力。」
由 NVIDIA Vera 驅動的 OCI 超級叢集,代表著超大規模 AI 超級運算的下一個前沿。
Oracle Cloud Infrastructure 執行副總裁 Mahesh Thiagarajan 表示:「Oracle Cloud Infrastructure 正快速擴展 AI 基礎架構,以因應訓練、推論與代理型 AI 的強勁需求。透過部署 NVIDIA Vera CPU,OCI 將能在下一代 AI 環境中支援高吞吐量的推論與資料處理工作負載。」
根據提供全面開源基準測試套件的 Phoronix,NVIDIA Vera 在代理型工作負載中展現出最快的整體效能,涵蓋程式碼編譯、Python、Java 及資料庫處理等項目。這些工作負載處於現代 AI 工廠的關鍵路徑上,包括代理工具使用與沙盒執行,而更快的 CPU 效能將提供更高的代理吞吐量與互動性。
專為代理型時代打造的客製化CPU
AI 工廠的經濟效益正從「每美元核心數」轉向「每美元詞元數」,這要求 CPU 能夠更快速、更高效地完成代理型運算、資料處理與編排工作。
Vera 搭載 Olympus,NVIDIA 自主研發的客製化 CPU 核心,專為應對這種轉變背後的 CPU 工作而設計,涵蓋 Python 執行環境、沙盒程式碼執行、編排邏輯與分析管道。
Vera 專為處理更多指令、預測應用程式行為,並在大量並行環境、查詢與資料處理任務間傳輸資料而生,配備 88 顆 Olympus 核心、空間多執行緒技術,以及可提供高達 1.2TB/s 頻寬的 LPDDR5X 記憶體子系統。這有助於減少代理在 CPU 密集步驟上的等待時間,讓 AI 工廠得以持續保持加速器的運轉。
Vera CPU 亦可部署於整個 AI 工廠,從獨立 CPU 基礎架構到緊密耦合的加速系統。Vera 協助 AI 為使用者提供更高的端對端吞吐量和更快的解決方案交付速度,從而提升訓練、推論和代理執行的反應速度和效率。
Vera 透過第二代 NVIDIA NVLink™-C2C 互連技術,擔任 NVIDIA Vera Rubin 平台的主機 CPU,在 CPU 與 GPU 之間提供高達 1.8TB/s 的一致性頻寬。此外,Vera 將 NVIDIA 機密運算延伸至機架級規模,為保護代理型工作負載。
NVIDIA Vera BlueField-4 STX 處理器將 Vera 與高效能網路、儲存加速及晶片內建安全功能整合在一起,打造以安全納入設計的 AI 原生資料平台。
廣泛的生態系支持
Vera CPU 提供高密度液冷機架配置,適用於大規模代理型 AI 與強化學習環境;同時亦提供靈活的雙插槽氣冷系統,滿足企業、雲端、資料處理與 AI 工廠的多元部署需求。
提供 Vera CPU 系統的領先基礎架構供應商包括 Aivres、永擎電子、華碩、仁寶電腦、戴爾科技集團、鴻海科技集團、技嘉科技、慧與科技、Hyve Solutions、英業達、聯想集團、神達電腦、微星科技、和碩聯合科技、雲達科技、美超微、緯創及緯穎。戴爾科技集團、慧與科技、聯想集團與美超微等主要原始設備製造商將以獨立 CPU 伺服器配置提供 Vera,成為 x86 架構以外的首款標準 CPU 選項。
計畫部署 Vera CPU 的領先雲端服務供應商包括:Akamai、字節跳動、Cloudflare、CoreWeave、Crusoe、Lambda、Nebius、Nscale、Oracle Cloud Infrastructure、Redpanda、Starburst、Together AI 及 Vultr。
上市時間
Vera 系統將於今年秋季起,透過系統製造商及雲端合作夥伴正式開放供應。
觀看黃仁勳的主題演講,並在 NVIDIA GTC Taipei 了解更多細節。
