MLPerf Inference v6.0基準測試展示了Intel Xeon 6和Intel Arc Pro B系列GPU,為工作站和邊緣系統提供強大、低延遲的AI推理能力
今天,MLCommons 發布了最新的 MLPerf Inference v6.0 基準測試,展示了英特爾 GPU 系統在四個關鍵基準測試中的表現。英特爾的 AI 系統搭載了 Intel® Xeon® 6 系列 CPU 和 Intel® Arc™ Pro B70 顯示卡,展現了適用於高階工作站、資料中心和邊緣應用的便利 AI 工作負載解決方案。
結果表明,配備四塊 GPU 的 Intel Arc Pro B70/B65 系統可提供 128GB 的顯存,以高並發性運行 1200 億參數模型,其中 Arc Pro B70 的推理性能比 Arc Pro B60 高出 1.8 倍¹。在開放的容器化軟體堆疊中配置的軟體最佳化,可有效地將推理效能從單節點擴展到多 GPU 企業級部署,從而提高效能,並且在相同的 Intel Arc Pro B60 硬體上,與 MLPerf v5.1 相比,效能提升高達 1.18 倍²。
「Intel Xeon 6 處理器與 Intel Arc Pro B 系列 GPU 的結合,體現了我們致力於擴大客戶選擇和提升價值的投入,為全球圖形專業人士和人工智能開發人員提供兼具領先性能和卓越價值的實用解決方案,這些方案既能滿足 LLM 模型的需求,也能滿足傳統機器學習工作負載的需求。”
英特爾副總裁暨人工智慧產品及上市推廣負責人、英特爾資料中心集團負責人 Anil Nanduri

重要性: 隨著對 AI 推理的需求不斷增長,專業運算市場正在經歷重大轉型,圖形創作者和 AI 開發人員在追求性能和價值的同時,又不損害數據隱私或承擔與專有 AI 模型相關的高額訂閱費用。
英特爾 GPU 系統採用全新發布的英特爾 Arc Pro B70/B65 GPU,旨在滿足現代 AI 推理的需求,並提供一個集全端驗證的硬體和軟體於一體的推理平台。憑藉增強的記憶體容量,該系統旨在簡化部署和使用,採用專為 Linux 環境構建的容器化解決方案,並透過多 GPU 擴展和 PCIe P2P 資料傳輸進行最佳化,從而提供卓越的推理性能,並包含企業級可靠性和可管理性功能,例如 ECC、SRIOV、遙測和遠端韌體更新。例如,與同類競品 GPU 解決方案相比,Intel Arc Pro B70 在多 GPU 配置中能夠處理更大的模型和上下文窗口,在運行大型模型時,KV 快取容量最高可達同類產品的 1.6 倍。
人工智慧推理的效能越來越不僅取決於 GPU 吞吐量,也取決於 CPU 加速的系統效能。 CPU 不僅決定叢集的整體效率和整體擁有成本,還負責記憶體管理、任務編排和工作負載分配等關鍵功能,同時確保現代人工智慧基礎設施所必需的安全性、可靠性和運作連續性。
英特爾始終是唯一提交獨立 CPU 測試結果參與 MLPerf 推理基準測試的伺服器處理器供應商,這凸顯了其在計算平台和加速器平台等多個領域對推進 AI 推理的領先地位和堅定承諾。作為 AI 加速系統中應用最廣泛的主機 CPU,超過一半的 MLPerf 6.0 測試結果均由至強處理器驅動,英特爾進一步鞏固了其在業界 AI 基礎設施核心的地位。
這種領先優勢也體現在晶片本身:搭載 P 核心的 Intel Xeon 6 處理器在 MLPerf Inference v5.1 測試中實現了高達 1.9 倍的代際性能提升,同時內置的 AMX 和 AVX512 等 AI 加速技術使得 LLM 推理、微調和加速器機器等工作負載無需運行硬體。
更多背景資訊: MLPerf 推理 v6.0 結果
1 根據 MLPerf Inference v6.0 基準測試,用於效能宣告的 Intel Arc Pro B60 配置為 Intel Xeon 698X、2 張 Arc Pro B60 Dual GPU 卡(相當於 4 張 Arc Pro B60)和 8 個 16GB DDR5 6400MT/s 記憶體。
截至 2026 年 2 月,用於效能聲明的 Intel Arc Pro B70 配置為 Intel Xeon 698X、4 張 Arc Pro B70 GPU 卡和 8 條 16GB DDR5 6400MT/s 記憶體。
2 根據 MLPerf Inference v6.0 基準測試和先前的 v5.1 基準測試,截至 2026 年 2 月,用於效能宣告的 Intel Arc Pro B60 配置為 Intel Xeon 698X、4 張 Arc Pro B60 Dual GPU 卡(相當於 8 張 Arc Pro B60)和 8 條 166024 400242408 4008 40008 張記憶體 160)。
