Amazon Web Services(AWS)宣布,專注於 Agent 建構、連接與優化的一站式平台 Amazon Bedrock AgentCore 推出多項新功能,幫助企業加速打造具有更廣闊知識和持續學習能力的 Agent。這些新功能將能夠整合 Agent 與企業內部知識、公開網路知識及付費知識資源,助力技術團隊快速定位、修復生產環境中的故障問題,並建置隨 Agent 能力提升同步擴展的管控體系。
驅動當今 Agent 的模型非常強大。它們能夠跨越複雜問題進行推理,規劃多步驟工作流程,並生成精準細膩的回應。但大多數 Agent 的實際表現遠未達到這樣的潛力上限。差距不在於智慧,而在於取得正確的上下文和回饋。
負責解答企業退款政策問題的客服類 Agent,若無法存取 SharePoint 中儲存的政策文件,便無法提供有效支援;撰寫市場簡報的研究類 Agent,若無法取得訓練資料之外的即時資訊,輸出的內容便會存在缺失;財務顧問類 Agent,若無法突破付費牆取得所需的即時市場資料,只能給出次等建議。而在所有場景下,多數團隊都缺乏系統化的方法,無法追蹤 Agent 部署後的效果優劣變化。
能力強大的模型僅僅是起點。讓 Agent 在生產環境中發揮效能的關鍵,在於使其能夠取得執行全部任務所需的一切:正確的知識、執行操作的資源以及持續改進的回饋迴圈。
知識更豐富、觸及更廣泛的Agent
Amazon Bedrock AgentCore 上的 Agent 已獲得對三層知識的原生存取權,每層知識都拓寬 Agent 可以觸及和完成的範圍,包括由 AgentCore 託管的企業知識層、公共知識層以及付費知識層。

企業知識層:Amazon Bedrock Managed Knowledge Base
企業最有價值的資訊散佈在 SharePoint、Google Drive、Confluence、Amazon S3 和內部 wiki 等地方。傳統方式下,要讓 Agent 能夠使用這些資訊,需要建造客製化的資料導入管道、優化檢索效果,並長期維護資料的時效性。往往需要耗費數月的工程開發工作,Agent 才能回答與企業自身業務相關的基礎問題。
目前已在 AgentCore 上線的 Amazon Bedrock Managed Knowledge Base(託管知識庫),可以代替上述工作。企業只需導入自身的非結構化資料來源,其餘工作都由 AgentCore 處理。平台管理向量儲存、檢索期間使用的嵌入和重排序模型,以及速率限制等擴展性問題,因此團隊可以專注於建構 Agent,而不是營運資料管道。
該功能的核心是遠超傳統檢索增強生成(RAG)的 Agentic 檢索器。它不是將查詢與最接近的文本片段做配對,而是跨企業的知識庫規劃查詢,連接各個文件中的相關概念,評估中間結果,並在回答之前進行重新排序。對於同時涉及多個主題的複雜多意圖查詢,Agentic 檢索的資訊覆蓋廣度與完整度,明顯優於基礎檢索方式。
公共知識層:Amazon Bedrock AgentCore上的Web Search(網頁搜尋功能)
內部知識存在局限性。法規不斷更新,市場持續變化,競爭對手也在不斷推出新產品。要讓 Agent 發揮最佳作用,就需要掌握企業外部的即時動態,以支援研究、事實核查、客戶服務、市場情報分析等工作。現在,AWS 為建構 AI Agent 的開發人員推出 Web Search 這個新工具。它提供來自網路的資訊,同時將資料保留在客戶安全的 AWS 環境中。
Web Search 基於 AWS 統一的搜尋基礎設施建構,該架構同時支援 AIexa+、Amazon Quick Suite 與 Kiro 等產品;它針對 Agentic 檢索進行優化,回傳的高價值內容能提高每單位 Token 的智慧密度。它還採用多源事實定錨方案,將公共網路資訊與 AWS 專有的知識圖譜相結合。該圖譜融合結構化的實體資料、經過驗證的事實以及股票價格和體育比分等即時資訊。
Web Search 將用戶的查詢保留在 AWS 安全和合規邊界內,無須引入額外的供應商,也沒有隨之而來的編排、身份驗證或計費工作流程。無論企業是在建構交叉引用公共來源的研究 Agent,監控法規和政策更新的合規 Agent,還是利用最新資訊定錨模型回應,Agent 現在都可以像查詢內部知識一樣對即時網路資訊進行推理。
付費知識層:AgentCore支付與AWS WAF AI流量變現
最好的資訊並不總是免費的,例如:金融市場動態、授權研究、專屬資料集、付費 API。如果 Agent 無法讀取付費資源,它將提供次優的答案,而用戶永遠不知道錯過了什麼。
讀取付費內容需要兩個部分:Agent 端需要支付能力,而供應商端則需要收費機制。上個月推出的 Amazon Bedrock AgentCore 支付功能因應 Agent 端的需求,讓 Agent 能夠在執行週期中發現付費服務和內容、進行支付並讀取它們。現在,正式可用的 AWS WAF AI 流量變現功能則因應供應商端的需求,使內容擁有者能控制 Agent 存取權限:可選擇阻擋、放行或收費。
由於這兩種功能都在同一個平台上執行,使用 AWS WAF 的供應商會自動辨識在 Amazon Bedrock AgentCore 上驗證的 Agent。最終形成一個可信任的管道:經過驗證的 Agent 享有更低的導入阻力,內容提供方則取得相應報酬。這兩項能力共同建構 Agent 經濟雙邊基礎設施,讓 Agent 能夠接觸所有資訊——而不僅僅是那些恰好免費的內容。
從每次交互中學習的Agent
提升 Agent 的知識取得能力只是問題的一方面。企業還需要了解 Agent 是否真正達成目標,並在表現不佳時及時發現問題。
這聽起來容易做起來難。最危險的 Agent 故障不是那些拋出錯誤的故障,而是那些在儀表板上看起來正常的故障:一個對未執行過的訂單修改發出確認的 Agent,一個在 API 超時時宣稱產品可用的 Agent,或者另一個跳過審核步驟,但在儀表板上顯示 99% 成功率的 Agent。這些故障不會產生錯誤訊號。它們在幾週後透過客戶投訴暴露出來,此時通常已影響了數千個對話。即便團隊察覺到問題,修復工作也大多依賴猜測:調整提示詞、修改工具描述、微調編排邏輯,最後只能寄望改動奏效,沒有系統化的方法可以驗證改動是否確實優化,還是悄悄引發其他問題。
現在,AWS 宣布 Amazon Bedrock AgentCore 推出全新的優化功能,將生產追蹤轉化為持續改進。這些功能共同形成一個迴圈:理解 Agent 的實際行為,生成資料驅動的修復方案,於部署前進行驗證,並確認實際成效。

理解Agent的行為:Insight 洞察功能現已提供預覽版,AgentCore 可在數百個對話中提供豐富的故障、意圖和軌跡洞察,揭露任何儀表板或逐筆追蹤審查都無法發現的模式。故障洞察可以發現重複發生故障的模式,例如不觸發錯誤訊號的隱性行為失效,詳細解釋每個故障的根本原因,並根據影響範圍排序,進而使人能一眼看出哪些問題對使用者的影響最大並優先修復。意圖洞察可以根據使用者的實際意圖對請求分群,進而能看到 Agent 的真實使用情形。軌跡洞察將 Agent 完成任務的執行路徑進行分組,以便能夠發現常見模式和異常值。可以透過每日或每週報告啟用持續監控,或者在部署後或投訴遽增時進行針對性分析,在幾分鐘內即可獲得結果。
充滿信心地修復:一旦知道要更改什麼,正式可用的建議功能和 A/B 測試功能將幫助團隊採取行動。建議功能透過分析追蹤和評估輸出,依據 Agent 實際行為對系統提示詞和工具描述提出具體改進建議。
隨著Agent能力增強,管控也需同步升級:全新策略增強功能
能力越強的 Agent 意味著越大的攻擊面。而且 Agent 帶來傳統軟體從未有過的安全挑戰:它們是機率性的。Agent 會做出判斷,而判斷可以被上下文影響。新的風險暴露點不再是網路,而是 Agent 的上下文,提示詞注入和記憶投毒不需要入侵系統,只需要說服 Agent 做出一個錯誤判斷。
安全保障機率性事物的方法是使用確定性的事物:不是作為大腦,而是作為周圍的護欄。Amazon Bedrock AgentCore 中的 Policy 策略功能已於閘道處提供即時的確定性控制,定義 Agent 對企業工具與資料的使用權限。
現在,AWS 透過 Amazon Bedrock Guardrails 整合擴展這些功能,並已正式可用,它會評估每個 Agent 操作以防止提示詞注入嘗試、有害內容和敏感資料洩露。這些檢查在閘道層執行,在 Agent 程式碼之外,Agent 無法在其上下文中看到它們,無法在推理時繞過它們,也無法說服自己它們不適用。
幾分鐘內從想法到執行中的Agent:Amazon Bedrock AgentCore harness執行環境正式可用
Agent 不只是一個模型。如果模型是大腦,那麼 Harness 執行環境就是支持大腦完成工作所需的身體。它執行編排循環、調用工具、管理上下文視窗、跨輪次保持狀態、從故障中恢復並隔離每個對話。Harness 對 Agent 效能表現的影響與模型同樣重要。建構一個穩健的 Harness 是目前大多數團隊花費最多時間的地方。
現已正式可用的 Amazon Bedrock AgentCore harness 為企業提供執行環境層的託管功能。無須為整個執行流程編寫程式碼,而是透過配置來定義 Agent:其使用的模型、調用的工具、可以讀取的技能以及遵循的指令。AgentCore 會動態組裝並驅動這個執行流程。透過該單一配置,企業可以在幾分鐘內獲得一個在自身隔離環境中執行的、可工作的 Agent。它配備檔案系統和 Shell、跨對話的記憶、Skills(包含 AWS 官方精選的 Skills 目錄),以及網頁瀏覽功能。這並不是一個會隨著業務規模擴大而淘汰的初學者工具:開始時使用的配置就是大規模營運時使用的配置,當需要自訂編排時,可以將 Harness 匯出為程式碼並保持在相同的平台上,而無須重新建立任何內容。
除了速度,它真正釋放的是市場上前所未有的選擇自由。目前可用的 Harness 方案都會讓企業被綁定在某個環節:開源方案需要自行託管和維運 Harness;託管服務會將企業鎖定在它們的環境中;模型廠商提供的 Harness 則只針對自家模型優化。而 AWS 將 Harness 與模型解除綁定,讓企業可以選擇任意模型,甚至在對話中途切換,而無須改動 Agent 邏輯。
選擇只是一部分。由於 Harness 是單一平台的一個組成部分,而不是包裹在框架周圍的託管層,因此它在調用工具時,都會透過同一個閘道進行分派——該閘道不僅強力執行安全性原則,同時也將 Agent 連接至企業知識、網路資訊和付費知識。身份、記憶和可觀測性都來自這同一個平台,因此 Agent 採取的每項操作都從第一次調用開始受到治理和追蹤,無須額外的線路連接。企業在第一天宣告的 Agent 就是第一千天執行的 Agent,自始至終建立在相同的基礎之上。

開始使用
Harness 執行環境託管功能、Managed Knowledge Base 功能、Web Search 功能、Guardrails 整合功能、建議和 A/B 測試功能,均已在 Amazon Bedrock AgentCore 上正式可用,同時 Insights 洞察功能和支付功能也已推出預覽版。使用者可以透過控制台或 AgentCore CLI 開始使用上述新功能,更多詳情請參考官方文件。
