- ● 推出全新的資料中心解決方案,包括高通 Dragonfly C1000 CPU、高通高頻寬運算 (HBC)、高通 Dragonfly AI300 推理加速器和領先的連接產品,以及客製化晶片解決方案。
- ● 高通 Dragonfly AI300 加入了AI200 和 AI250 的行列,成為我們多代 AI 加速器路線圖的一部分,並保持年度更新節奏。
- ● 高通公司新推出的高頻寬運算(HBC)技術突破了記憶體瓶頸,降低了每個代幣的能耗。
- ● 來自領先的人工智慧和資料中心公司的多年期、多代資料中心協議。
- ● 獲得來自科技生態系統中 35 家以上領導者的廣泛產業支持。

高通技術公司(NASDAQ:QCOM)今天在其投資者日活動上宣布推出一系列全新的資料中心解決方案,包括高通 Dragonfly ™ C1000 CPU、高通®高頻寬運算 (HBC)、高通 Dragonfly ™ AI300 推理加速器以及連接產品,同時也提供客製化晶片解決方案。
所有這些解決方案均旨在最大限度地提高每瓦效能和令牌吞吐量,並降低整體擁有成本。這些新平台凸顯了高通技術在建構全端式人工智慧優化資料中心基礎架構方面日益重要的地位,涵蓋智慧體和資料中心級 CPU、人工智慧推理加速器、高效能連接以及大規模客製化晶片解決方案。高通 Dragonfly AI300 的加入,進一步豐富了先前發表的高通 Dragonfly AI200 和 AI250 等產品,並遵循年度人工智慧加速器路線圖。
「智能體人工智慧正在顯著提升資料中心對人工智慧推理的需求。隨著這類工作負載逐漸成為主流,基礎設施必須以更低的功耗和成本提供更高的效能,」高通公司總裁兼執行長克里斯蒂亞諾·阿蒙表示。 “這正契合了高通的優勢,我們已做好充分準備迎接這一轉變。通過高通 Dragonfly,我們將高性能、低功耗的計算能力引入數據中心,並與領先客戶簽署了多年、多代合作協議。”
高通技術公司憑藉數十年來在系統單晶片 (SoC)、低功耗設計、高效能處理和領先 IP 領域的專業知識,以及超過 400 億個元件的工程經驗,打造出專為超大規模資料中心級、代理密集型 AI 推理工作負載而設計的解耦式機架級 AI 基礎設施。
這些創新實現了更優的代幣經濟性、更低的延遲、更簡化的整合、可擴展的部署以及更低的整體擁有成本。隨著代理 AI 大幅提升代幣需求,高通技術公司的解決方案以每瓦代幣數為關鍵槓桿,旨在降低整體擁有成本 (TCO)。
「企業現在需要的遠不止是單一元件。在分散式、始終在線的基礎設施上協調多種類型的運算至關重要,」高通技術公司執行副總裁兼資料中心總經理 Tony Pialis 表示。 「借助高通 Dragonfly,我們將計算、人工智慧、內存和連接整合到一個統一的機架級平台中,該平台專為日益複雜、代理驅動的工作負載而設計,同時解決了記憶體頻寬和功耗方面的關鍵瓶頸。這建立在高通技術公司數十年來一直致力於提供的高性能、低功耗大規模計算之上,如今,我們將其應用於數據中心。
從矽晶片到機架:一個解耦式機架級人工智慧推理平台
高通Dragonfly C1000 CPU
- ● 這款專為資料中心打造的 CPU 旨在為代理、通用和 AI 主節點工作負載提供卓越的效能和利用率,同時兼具一流的能源效率和整體擁有成本 (TCO)。
- ● 客製化設計的 Qualcomm Oryon ™ CPU 內核,針對核心效能和 5 GHz 以上的頻率進行了最佳化,可為大規模部署的代理程式工作負載提供卓越的效能。
- ● 採用超過 250 個核心的晶片組設計,在提供卓越單核心效能的同時,實現出色的吞吐量和擴充性。
- ● 與現有伺服器 CPU 競品相比,基於規格參數的每瓦效能預估提升 2 倍以上
- ● 架構和設計旨在為關鍵資料中心應用提供最佳吞吐量、響應速度和基礎設施利用率,同時降低資本支出和營運支出,從而在規模化應用中實現一流的整體擁有成本 (TCO) 效能。
- ● 多晶片架構支援模組化集成,並採用先進的封裝技術,可實現效能和 I/O 擴展,適用於資料中心領域的通用型到 AI CPU。
- ● > 2 TB/s 領先的 PCIe Gen 7 連接速度,加上 CXL 連接,可支援下一代加速器、高速網路和儲存以及記憶體解耦。
- ● 採用領先的低功耗記憶體技術,打造出具有卓越頻寬、容量、低延遲和高能源效率的記憶體子系統。
- ● 基於 CPU 的推理,可選配 HBC 連接
- ● 該產品採用先進的可靠性、可用性和可維護性 (RAS) 功能構建,包括 ECC、故障隔離和錯誤恢復,從而實現大規模彈性運作。
- ● 支援風冷和液冷,可部署於各種資料中心環境,並相容於 OCP ORv3 標準的機架和伺服器。
- ● CPU 產品組合包括:專為高吞吐量代理編排和低延遲互動式 AI 用例設計的代理 CPU;專為第一方工作負載提供最佳性價比,並為第三方應用彈性提供最佳虛擬 CPU 性能的通用 CPU;以及旨在透過高速 CPU 實現低開銷主機處理,從而最大限度地利用 XPU 進行生成式 AI 計算的 AI 頭節點 CPU。
- ● 預計 2028 年上市。

高通高頻寬計算(HBC)
- ● 一種創新的專用近記憶體運算架構,它將運算能力與高速記憶體頻寬結合在 3D 堆疊矽解決方案中,以解決人工智慧的根本資料傳輸瓶頸。
- ● 與高頻寬記憶體 (HBM) 相比,HBC 擁有多代發展路線圖,旨在以更低的整體擁有成本和更高的能源效率,提供更快、更有效率、更具可擴展性的處理能力。
- ● 採用 HBC Gen 1 技術的 AI250 旨在實現業界領先的單卡 133 TB/s 讀寫速度,相比採用 LPDDR5X 的 AI200,有效內存頻寬提升 18 倍;採用 HBC Gen 2 技術的 AI300 則旨在實現 AI200 更進一步的性能提升,相比高達 200 倍性能提升,相比高達 250 倍。
- ● 與HBM相比,HBC旨在實現每瓦頻寬提升6倍(基於卡級標準化後的競品規格)。
- ● 與SRAM相比,HBC旨在實現每瓦容量提升200倍(基於機架級標準化後的競品產品規格)。
- ● HBC旨在實現AI代理的高效擴展,以滿足持續推理、記憶體頻寬和即時回應的需求。
- ● 我們與供應鏈的策略合作關係以及獨特的實施方案,憑藉3D整合、系統級設計、LPDDR領先技術和能源效率方面的專業知識,有效應對了近記憶體運算的複雜性。
- ● 預計搭載 AI250 的 HBC Gen 1 將於 2027 年年中開始商業化樣品測試。
影片:https://players.brightcove.net/1414329538001/q6zFl8svi_default/index.html?videoId=6399199998112
高通Dragonfly AI300
- ● 繼去年十月推出 AI200 和 AI250 解決方案之後,第三代風冷和液冷機架式 AI 推理平台正式發表。
- ● AI300 整合了突破性的高通 HBC Gen 2 技術,可加速運算,並整合記憶體並提高有效記憶體頻寬,專為分散式推理部署而設計(AI250 使用 HBC Gen 1)。
- ● 具備業界領先的記憶體容量和有效頻寬,可為大型語言和多模態模型(LLM、LMM)推理和智能體人工智慧工作負載提供高吞吐量、低延遲的效能。
- ● 每卡每瓦記憶體頻寬效能預計將比現有基於 GPU 的架構提升 4-8 倍。
- ● 利用 UALink(Ultra Accelerator Link,超高速加速鏈路)和 ESUN(Ethernet for Scale-Up Networking,乙太網路擴展網路)實現向上擴展;利用銅纜和光纖實現向外擴展。
- ● 預計 2028 年開始商業抽樣。

- 面向下一代人工智慧和雲端資料中心基礎設施的大規模效能優化矽晶片
- 專為智慧體人工智慧和其他特定工作負載客製化的晶片
- 具備涵蓋晶片、系統和軟體的端到端協同設計能力,以滿足客戶特定的效能、功耗和整合要求。
- 先進的封裝和模組化架構旨在提高效能、能源效率和可擴展性
- 成熟的智慧財產權和精簡的設計執行流程,有助於加快產品上市速度並降低執行風險。
- 從設計到大批量生產的執行,並依賴生態系統和供應鏈關係。
- 涵蓋晶片間、銅纜、光纖和園區級互連的廣泛連接產品組合,適用於下一代人工智慧資料中心
- 支援光纖、AOC 和 AEC 應用中的高頻寬 800G 和 1.6T 連接,從資料中心內部鏈路到最遠 20 公里的園區部署。
- 結合高通技術公司的 SerDes、PAM4、輕量級相干 DSP、訊號完整性和遙測功能,以支援可擴展的高效能 AI 基礎設施
- 解決日益分散、分散和頻寬密集基礎架構中,對人工智慧資料中心效能至關重要的資料傳輸瓶頸問題。
整個生態系統
除了新的高通 Dragonfly 資料中心產品組合外,高通技術公司還宣布與 Meta 達成一項多年、多代協議。
高通技術公司和 Meta 公司今天宣布達成一項策略性的多代合作,高通技術公司將成為 Meta 公司資料中心 CPU 的供應商。高通技術公司的資料中心 CPU—高通 Dragonfly ™ C1000 —計畫用於 Meta 公司的下一代伺服器,凸顯了高效能、高能源效率運算在大規模橫向擴展環境中日益增長的重要性。
此外,來自科技和人工智慧生態系統的 35 多家全球領導者也公開支援高通科技公司的資料中心願景和商業解決方案,其中包括 Advantest、Arista、Astera、Cirrascale、Compal、Confidential Core AI、Core42、台達、Fibercop、富士康、技嘉科技、華聯科技業想 Technology、美光科技、南亞科技、NEC、NeuReality、廣達、和碩聯合科技、三星 SDS、Saptiva AI、SK 海力士美國、Supermicro、Teradyne、TeraHop、聯電、VAST Data、Viettel IDC、VNPT 集團和緯創資通。
高通技術公司致力於制定多代資料中心路線圖,並以年度為週期,專注於提升人工智慧推理效能、能源效率和整體擁有成本。欲了解更多信息,請訪問我們的網站。
