NVIDIA Nemotron 3 開放模型可解鎖 OpenClaw 等兼具高效與私密的 AI 智慧代理;RTX 最佳化的 NVFP4 和 FP8 視覺生成式 AI 模型,加速創作工作流程。

消費級運算長期以「個人裝置」為核心,從 PC 到智慧手機、平板電腦皆是如此。如今,以 OpenClaw 為代表的生成式 AI,開創導出一個全新品類:代理電腦。無論是 NVIDIA DGX Spark 桌上型 AI 超級電腦,或專為 AI 最佳化打造的 NVIDIA RTX PC,都能在兼顧隱私且免費的前提下,出色運行個人智慧代理。
本週舉行的 NVIDIA GTC 大會,發布一系列代理 AI 相關重要消息,包括:
- ●適用於地端智慧代理的全新開放模型,包括 NVIDIA Nemotron 3 Nano 4B 和 Nemotron 3 Super 120B,以及針對 Qwen 3.5 和 Mistral Small 4 的最佳化。
- ●NVIDIA NemoClaw:專為 OpenClaw 打造的開源軟體堆疊,透過提升安全性並支援地端模型,進一步最佳化 OpenClaw 在 NVIDIA 裝置上的體驗。
- ●使用 Unsloth Studio 更輕鬆地進行微調,進一步提高開放模型在代理式工作流程中的準確性。
親臨 GTC 現場的與會者,還可前往 GTC Park 參加 NVIDIA Build‑a‑Claw 活動。現場由 NVIDIA 技術專家協助參與者,透過自選裝置客製化並部署一款主動式、全天候的 AI 助理。無論是否具備技術背景,參與者都能為自己的 AI 代理命名、設定個性,並配置所需的工具權限,打造出可透過常用即時通訊 App 隨時聯繫的個人助理。
全新開放模型為地端智慧代理帶來雲端級品質
新一代本地模型具備越來越大的上下文視窗,為在 PC 上運行代理提供智慧能力。結合更豐富的使用者上下文資訊和強大的地端工具,這些進展正在為 AI PC 開啟更多的可能性,尤其是在配備 128GB 的統一記憶體、可支援超過 1,200 億個參數規模的 DGX Spark 上,更能充分展現其優勢。
日前發布的 Nemotron 3 Super 是一款擁有 1,200 億參數、其中 120 億為活躍參數(active parameter)的開放模型,專為運行複雜的代理 AI 系統而設計。Nemotron 3 Super 非常適合在 DGX Spark 或 NVIDIA RTX PRO 工作站上運行智慧代理。在 PinchBench 這項用於評估大型語言模型與 OpenClaw 搭配表現的新基準測試中,Nemotron 3 Super 取得了 85.6% 的成績,遙遙領先同類開放模型。
Mistral Small 4 是一款擁有 1,190 億參數的開放模型,具有 60 億個活躍參數,若計入所有層的活躍參數則為 80 億,整合了 Mistral 旗艦模型的功能。如今,使用者已可運用此款針對一般聊天、程式設計和代理式任務最佳化的超高效模型。
兩種模型皆可在 DGX Spark 和 RTX PRO GPU 上地端運行。
對於尋求更輕量模型的 GeForce RTX 使用者而言,Nemotron 3 Nano 4B 是 NVIDIA Nemotron 3 系列開放模型的最新成員,可為在 RTX AI PC 上地端構建智慧代理和 AI 助理,提供緊湊且強大的起點。該模型特別適合用於打造遊戲和應用程式中執行操作的對話型角色,並能在資源受限的硬體上順暢運行。適用於任何搭載 NVIDIA GPU 的系統,同時結合最先進的指令遵循能力、出色的工具使用能力,以及極低的 VRAM 佔用。
此外,NVIDIA 還宣布針對阿里巴巴的 Qwen3.5 模型進行最佳化,該模型包含 27B、9B 和 4B 參數版本,展現出卓越的精準度,適合在 NVIDIA GPU 上運行地端智慧代理。本次新模型原生支援視覺處理、多 Token 預測,以及 262K 的超大上下文視窗。其中,擁有 270 億稠密參數的模型,在搭配 RTX 5090 GPU 時表現尤為出色。

使用者現在可以透過 Ollama、LM Studio 和 llama.cpp 體驗模型,並由RTX GPU 和 DGX Spark 提供加速推理。詳細瞭解 NVIDIA 開放模型的最新動態。
利用經RTX最佳化的最新模型,讓創作AI更高效
Lightricks 於本月初發佈的先進的音訊影片模型 LTX 2.3,現已推出 NVFP4 和 FP8 蒸餾模型(distilled model),可將效能提升至原先的 2.1 倍。進一步瞭解 Lightricks 的 LTX 2.3 模型。
影片參考:Introducing LTX-2.3: Our Most Production-Ready Model Yet
此外,Black Forest Lab 的 FLUX.2 Klein 9B 也於日前更新,將影像編輯速度提升至原先的 2 倍。NVIDIA 與 Black Forest Labs 合作發布了 FP8 版本,並針對 RTX GPU 進行最佳化,以實現更快的效能和更佳的記憶體使用效率。
NVIDIA NemoClaw——NVIDIA針對OpenClaw的最佳化
AI 開發者和愛好者紛紛購置 DGX Spark 超級電腦,或打造專用的 RTX PC,以運行如 OpenClaw 等自主式 AI 代理。這些 AI 代理能從個人檔案、應用程式和工作流程中擷取上下文資訊,並自動執行日常任務。然而,隨著 OpenClaw 等代理式系統的應用日益廣泛,外界對 Token 成本,以及安全隱私的疑慮也日益上升。
為協助因應此需求,NVIDIA 推出 NemoClaw,為基於 OpenClaw 的開源軟體堆疊,可在 NVIDIA 裝置上部署 OpenClaw 的最佳化。NemoClaw 首批提供的功能包括 NVIDIA Nemotron 開放模型,以及 NVIDIA OpenShell 執行階段。Nemotron 地端模型可讓使用者在地端運行推理,代表著更佳的隱私保護,且無需耗費 Token 成本。OpenShell 則是專為更安全地執行 Claw 而設計的執行階段。
更多資訊請參考 NemoClaw。亦可觀看 NVIDIA 創辦人暨執行長黃仁勳的 GTC 主題演講,並探索更多會議內容。
透過Unsloth Studio輕鬆進行微調
隨著開放模型持續發展,進一步提升模型準確度的方法之一,是透過微調,讓使用者能依據自身資料與使用情境,對模型進行客製化調整。然而,該技術通常需要深厚的技術專業、編碼知識和大量的配置作業。作為模型微調與對齊領域的領先開源庫,Unsloth 推出 Unsloth Studio,為一款易於使用、以網頁為基礎的使用者介面,旨在為 AI 愛好者和開發者簡化微調流程。
請參考相關內容:https://youtu.be/mmbkP8NARH4
Unsloth Studio 支援超過 500 種 AI 模型。其簡潔的使用者介面讓訓練和微調過程變得更加便捷:使用者只需上傳資料集,點擊圖形化畫布,即可生成額外的高品質合成資料,並啟動微調任務。該工具支援量化低秩適應(quantized low-rank adaptation)、低秩適應(low-rank adaptation),以及完整微調。在模型微調過程中,使用者也能即時監控並視覺化任務進度。使用者最終可在同一網頁應用程式中,將微調後的模型匯出至所選框架,並立即開啟對話。
Unsloth Studio 的新介面建構於 Unsloth 函式庫,透過客製化和專用 GPU 內核,可在訓練過程中實現最高 2 倍的加速效果,同時節省高達 70% 的 VRAM。意味著新使用者無需繁複設定,即可直接充分發揮其 NVIDIA RTX GPU 和 DGX Spark 的效能。
立即體驗 Unsloth Studio,包括搭配 Nemotron 3 Nano 4B 和 Qwen 3.5 等新模型。也可參閱其他 RTX AI Garage 文章,進一步了解使用 NVIDIA GeForce RTX GPU 微調模型。
NVIDIA GTC 2026最新進展
RTX AI 影片生成指南,介紹如何在 ComfyUI 中使用 RTX Video:今年稍早在消費性電子展 CES 發布的全新 RTX AI 影片生成指南,向創作者和愛好者展示如何透過引導式文本轉影像的工作流程,從概念推進至創作,為 AI 生成的影片製作關鍵畫格,再利用在地端 GPU 上運行的 RTX Video 技術,將其升級到 4K 畫質。歡迎體驗,並在社群媒體上使用 #AIonRTX 分享創作成果。
NVIDIA AI for Media 是一套高效能、易於使用的軟體開發套件,可將 NVIDIA Broadcast 級 AI 特效——包括增強的音訊處理(支援 Linux 或 Windows 系統)、影片處理及擴增實境功能——導入到直播、視訊會議,以及後期製作工作流程中。最新版本更新包括:透過 RTX 影片超解析度技術,在 RTX PRO 及 GeForce RTX 40 和 50 系列 GPU 上實現更準確的唇形同步、多人對話即時偵測,以及更快的 4K 畫質提升,同時也進一步最佳化 NVIDIA Studio Voice 的背景降噪功能並降低延遲。
NVIDA DLSS 5 將於今年秋季推出,透過讓像素加入擬真光照與材質效果,帶來由 AI 驅動遊戲影像保真度的突破躍進,讓渲染呈現電影級視覺效果。
Maxon 已發布 Redshift 2026.4 版本,該版本導入由 DLSS 技術驅動的全新即時視覺化工作流程,使建築師能夠以兼具互動速度和畫質的方式,在專案中流暢穿梭。Maxon 技術與人工智慧長 Philip Losch 表示:「NVIDIA 的 DLSS 技術是關鍵元件,使我們能夠以互動式速度呈現高品質視覺效果。」
Reincubate Camo 已在其 Camo Streamlight App 中新增對 Windows ML NVIDIA TensorRT RTX EP 的支援,以實現 AI 自動調整功能,顯著提升 RTX GPU 上的效能表現。
