平台的變革始於開發者的創新,他們探索創新、選擇工具、發想創意,並將想法化為現實。
這波平台轉型帶來前所未有且觸手可及的資訊量。這場轉變不僅止於快速開發,接下來更包含建置、營運、最佳化與觀測。從打開筆記型電腦到在正式環境部署應用程式的那一刻,以無縫且不影響效率的方式保護基礎架構、應用程式與 AI agent。
然而,開發者具有雙重角色:一方面是工匠般的創作者,能自由選擇適合的工具與模型;另一方面是企業系統的建構者,負責打造從第一天起即具備治理能力、安全性與可信任基礎的解決方案。
因此,開發者需要的並不是另一種單純用於建置與執行 agent 或應用程式的方法,而是信任機制。他們需要原生環境的脈絡與領域專業知識,更重要的是,需要能夠依據不同問題選擇最合適模型的自主權。
這雙重的特性正是微軟擅長之處,微軟自問:怎麼樣才算是一位現代開發者?微軟於 Build 大會分享,在「智慧無所不在」的時代中,如何賦能開發者進行建構,同時提供企業級規模所需的控管與安全性,並在一個模型多元、開放且異質的技術平台上實現這一切,讓既有的知識與世界原生的智慧得以整合共存。

今年的 Build 大會有許多重要訊息,聚焦在三個核心主軸。
第一,真正屬於使用者的智慧。透過 Microsoft Agent Platform(一個由 Microsoft IQ 提供使用者情境脈絡與智慧能力的平台),開發者可以在 GitHub 中打造 agent,並部署至 Microsoft Foundry,系統將自動優化並選擇最適合任務的模型,讓 agent 程式同時連結企業內部與全球知識資源,並可透過 Microsoft Teams、Microsoft 365 或團隊日常使用的各種場景進行存取。此設計旨在降低開發過程中在情境與治理、安全與速度、模型與工具之間的取捨。
第二,是依照開發者需求打造的全堆疊。開發者能以自己偏好的方式進行開發,選擇合適的工具、模型與工作流程,並將構想落實為實際應用。這不僅限於 agent 平台,而是延伸至技術堆疊,涵蓋從晶片、作業系統到開發工具與雲端服務,並以 Windows 為起點。Windows 不再只是「給 Windows 開發者使用的 Windows」,而是「給所有開發者的 Windows」。微軟正在推出全新的開發者配置,提供更高的彈性、更流暢的智慧殼層與終端體驗、agents 的本地沙盒、Windows Subsystem for Linux 全新功能,以及更強大的本機執行能力,讓開發者能直接在本機端完成開發與 AI 工作流程。
第三,是著眼於下一個階段。代理式系統(agentic systems)將從程式碼開發進一步擴展至推動人類進步,放大科學家與研究人員的潛能。科學與運算領域的新前沿也將建立在相同的開發者平台基礎之上。
從筆電到雲端,開發者將擁有完整的多模型生態系,能夠在不犧牲掌控力與創造力的前提下打造下一波技術創新。而一如既往,一切都從開發者開始。
了解使用者、其企業與世界的Agents
隨著 AI 模型能力持續提升且日益普及,企業的競爭優勢已不再取決於是否取得 AI,而是能否掌握。如何將企業的專業知識、資料與工作方式,轉化為一套能夠持續學習並不斷創造更佳成果的系統?微軟希望打造一個讓企業擁有自主性的生態系,而非將價值持續回流至顧問或模型開發商。
企業的 agent 要能夠反映組織的思維模式與營運方式,涵蓋商業邏輯、企業知識,以及各項工作流程,真正成為企業能力的延伸。
而這一切的基礎來自於情境脈絡資訊。Microsoft IQ 現已於 GitHub Copilot、Microsoft Foundry 與 Copilot Studio 正式推出,作為全新的情境脈絡層(context layer),讓 agent 能夠同時運用全球與企業的知識作為基礎。Work IQ 是專為 agent 設計的工作場所智慧層(workplace intelligence layer),能夠擷取實際工作流程在 Microsoft 365、企業系統及外部資料來源中的運作方式,包括人員、電子郵件、文件、會議及其彼此之間的關聯。
Work IQ API 將於 6 月 16 日正式推出,提供對此智慧層的程式化存取能力,讓 agent 取得在組織內有效運作所需的情境資訊。Fabric IQ 則為結構化商業資料提供共享的語意基礎。Foundry IQ 將上述能力整合在一起,並支援橫跨企業知識與即時網路資訊的檢索規劃(retrieval planning)。
加入此系列的全新產品是今日正式宣布的 Web IQ,是能為 agent 提供真實世界情境基礎(grounding)的最快方式。這是一套 AI-first 的網頁搜尋技術堆疊,具備不綁定特定模型(model-agnostic)與原生支援 MCP 的特性,能以接近市場次佳方案 2.5 倍的速度回傳相關內容片段。
微軟也正在探索這些情境脈絡如何應用於新的產品形態,特別是全天運作的自主型 agent。Microsoft Scout 是一款全新的個人工作 agent,今日將率先提供給 Frontier 客戶使用。建立於 OpenClaw 與 WorkIQ 之上,Scout 能理解使用者的工作方式,並運用你日常使用的工具,例如 Teams 與 Outlook,在不需詢問的情況下主動處理工作事項,包括會議準備、行程衝突調整以及例行性任務。微軟也十分期待在未來分享更多進展,並逐步擴展 Scout 的能力與服務提供範圍。
在模型層面,微軟 AI 超級智慧團隊(Microsoft AI Superintelligence Team)發表一系列共七款的自研模型,其中首發的 MAI-Thinking-1 是微軟 AI 的首款推理模型。該模型從零開始訓練,未經任何知識蒸餾,採用企業級、乾淨且具商業授權的資料集,讓開發者能安心進行建置與應用。
MAI-Thinking-1 為中型模型,具備 350 億個活躍參數,以及 256K 上下文窗口(Context Window),專為高效率與高效能設計,同時維持較低的詞元(token)成本。在盲測評估中,獨立評測者更偏好其表現優於 Sonnet 4.6[1],並在 SWE Bench Pro[2] 的程式碼能力測試中達到與 Opus 4.6 相當的水準。MAI-Thinking-1 特別針對複雜的多步驟指令、長上下文推理與程式碼生成進行最佳化,目前已於 Foundry 進入私人預覽階段。
但這並不是唯一的新模型,MAI-Image-2.5 及其 Flash 版本是微軟首款同時支援文生圖(於 Arena AI 排行榜排名第三)以及圖生圖(image-to-image,於 Arena AI 排行榜排名第二,超越 Nano Banana Pro)能力的模型。這些模型特別適用於創意工作流程,能協助使用者將概念轉化為實際圖像,或進一步優化既有圖像作品。這些模型已整合至 PowerPoint,並正逐步導入 OneDrive,今日也已正式在 Foundry 推出,效能與成本比達到領先市場的水準。
MAI 家族還有其他新成員,包括:MAI Transcribe 1.5 在 43 種語言中具備領先的準確度,並將很快支援串流功能。MAI-Voice-2 及其 Flash 版本現已支援超過 15 種新增語言,並提供更多全新語音選項。此外,MAI-Code-1 是微軟專為 GitHub 調校的高推理效率程式碼模型,目前已可在 Copilot 與 VS Code 中使用。
開發者的選擇不僅限於微軟的產品,MAI 模型也將可在 Fireworks AI、Baseten 與 OpenRouter 上使用。同時,Fireworks AI 現已於 Foundry 全面推出,讓開發者無論選擇哪一種模型,都能在單一平台上獲得具備企業治理能力與 Azure 資料落地的整合體驗。
對於希望真正讓智慧成為企業自身資產的組織而言,Frontier Tuning 透過在合規性範圍內進行增強式學習,使 agent 能夠學習企業實際運作方式。透過企業自身資料、領域知識與工作流程,形成一個隨著 agent 持續運作而不斷優化的學習循環。此功能今日已進入私人預覽階段。
安全性與治理能力則貫穿整個系統。Agent 365 for local agents 將 Entra、Defender 與 Purview 延伸為單一控制平面,讓企業能在不同部署環境與框架下,對所有 Agent 進行觀測、治理與安全防護。這正是實現高速開發同時維持可控性的關鍵方式。
此外,微軟也推出一套開放、端到端的 AI agent 信任堆疊,適用於任何框架,並以兩項開源專案為基礎:Adaptive Spec-driven Scoring for Evaluation and Regression Testing(ASSERT),用於以政策為導向的安全評估;以及 Agent Control Specification,用於在 agent 運作流程中應用控制機制位置與方式的標準化。
同時,微軟也進一步強化防護能力,推出代號 MDASH 的新一代多模型 agent 安全系統。該系統部署超過 100 個 agent,透過對資料流、商業邏輯與攻擊鏈的推理來發掘可被利用的漏洞,並將具備情境感知的修復建議直接交付至 Defender 入口網站。
完整技術堆疊,由使用者掌握
當我們思考代理式時代的工作型態,將會需要一個橫跨雲端與邊緣端、無所不在的智慧平台。然而,對開發者而言,關鍵在於如何在維持掌控的同時,建構這些高度複雜的 agent 系統。這代表開發者必須持續維持開發流程中的流暢狀態,而不是為了等待工具而中斷,並在數分鐘內完成實驗,而非花費數小時。
這一切始於晶片層級,而這正是 Surface RTX Spark Dev Box 的設計初衷:專為長時間運算負載打造,包括長時間訓練任務、agentic AI 管道,以及本地模型微調。
搭載 NVIDIA RTX Spark,其 AI 運算效能最高可達 1 petaflop,並配備 128 GB 統一記憶體,可在本地執行 agents 工作負載,執行高達 1,200 億參數的大型語言模型,並支援最高達 100 萬個詞元的上下文長度,無需依賴雲端 GPU 執行個體[3]。系統預先配置 Windows Subsystem for Linux(WSL)2,支援原生 GPU 直通與完整 CUDA 支援,並預先安裝 Visual Studio Code、GitHub Copilot 等開發者常用工具。Surface RTX Spark Dev Box 將於今年稍晚於美國市場透過 Microsoft.com 上市。
在作業系統層面,微軟正將 Windows 打造成原生支援 agent 的執行環境(agent-native runtime)。現已進入預覽階段的 Microsoft Execution Containers(MXC)為開發者與 IT 管理人員提供更簡便的方式建立企業級 agent 沙盒環境,並由作業系統本身負責執行隔離。開發者只需定義一次需求,Windows 即可在所有 agent 執行環境中一致套用相關規範。
OpenClaw 已將這項技術應用於 Windows,使多步驟工作流程能夠在作業系統強制的安全範圍內執行,NVIDIA 自主代理 OpenShell 安全執行環境採用 MXC,並加入政策管理、推論路由(routing)以及個人識別資訊(PII)混淆功能。透過結合這些能力,為開發者提供一個安全的 agent 開發與部署環境,同時也為 IT 團隊在本地裝置與雲端環境中提供所需的治理工具。
當 agent 轉移至雲端時,目前處於預覽階段、由 Foundry Agent Service 提供的託管 agent,能以可擴展的方式實現相同模式,為每個對話提供可即時啟動的沙盒環境、隔離執行、持久記憶,以及彈性擴展能力,可以把它視為 agent 的基礎元件,如同容器之於雲原生應用程式。
無論是在整合開發環境(IDE)還是在命令列中,agent 開發流程都能協助以前所未有的速度撰寫程式碼,但這只是軟體建構過程中的一部分。
GitHub Copilot 應用程式目前處於預覽階段,將 agent 開發帶入原生桌面體驗,並觸及更廣泛的使用族群。使用者可以從一個想法、既有的 Issue 或 Pull Request(PR)開始,同時協調多個 agent 對話,讓變更持續推進至審查、持續整合(CI)與合併流程。每個對話都使用 git worktree,因此各項工作互不干擾,Copilot 負責執行任務,而開發者則掌控流程。
開發人員可以在幾秒鐘內生成應用程式,但要將這些應用程式真正部署到生產環境,仍需要整合資料庫、API、身分驗證機制以及基礎架構等多項要素。
在平台層面,目前處於預覽階段的 Project Rayfin 正是為了解決這項挑戰而推出。它為 Microsoft Fabric 帶來託管式與後端即服務(Backend-as-a-Service,BaaS)能力,並透過以 GitHub 為基礎的工作流程定義,讓開發人員無需管理基礎架構,即可順利將原型快速推進至正式生產環境。透過與 Replit 的整合,開發人員可建立一條從原型開發到企業級部署的快速通道,並從 Day 1 即納入治理機制。隨著代理式應用的規模持續擴大,Azure HorizonDB 提供能滿足最嚴苛資料庫所需的效能與可靠性。這是一項在 Azure 上提供的全託管 PostgreSQL 服務,根據內部測試結果,其資料處理能力超過同類型自主管理方案的三倍。
未來將由開發者創造
正如長時間運行的 agents 已重新定義軟體開發以及開發人員的角色,新一代 agents 也將改變研發方式,並重塑科學家所能達成的成果。
Microsoft Discovery 今日已全面推出,其建立於 Azure 中,為研究人員提供企業級的 agentic AI 平台,涵蓋完整的科學研究流程。BHP 使用 Microsoft Discovery 在數月內找到銅浸出解決方案,而過去可能需要數年;Syensqo 用於加速半導體研發;GSK 則用於迭代藥物研發流程。此外,微軟宣布推出一款免費的 Discovery 本地應用程式,面向更廣泛的科學社群,目前處於預覽階段,透過 GitHub Copilot 帳號即可使用。
最後,新一代量子運算晶片 Majorana 2 象徵邁向大規模量子運算的重要里程碑,其量子位元(qubit)平均壽命達 20 秒,部分甚至可長達一分鐘,可靠性較前一代提升 1,000 倍,並可於一枚手掌大小的晶片上運算 100 萬個量子位元的發展路徑。在 agentic AI 的協助下,我們預計將於 2029 年底前實現可擴展的量子運算系統。
平台不會自行演進,而是由開發者持續推動向前。微軟希望為開發者提供更多工具與能力,協助打造下一個世代的創新應用。
以上僅為今年 Build 大會的部分重點,完整內容請參閱 Microsoft Build Live 部落格。了解更多開發者相關更新資訊。
[1] 由微軟的合作夥伴 Surge 進行人工評估。
[2] 根據 SWE Bench Pro 基準測試結果。
[3] 資料來源:NVIDIA,數據基於稀疏性(sparsity)下所達到的理論 FP4 TOPS 效能。
