Amazon Web Services(AWS)宣布,專注於Agent建構、連接與優化的一站式平台Amazon Bedrock AgentCore推出多項新功能,幫助企業加速打造具有更廣闊知識和持續學習能力的Agent。這些新功能將能夠整合Agent與企業內部知識、公開網路知識及付費知識資源,助力技術團隊快速定位、修復生產環境中的故障問題,並建置隨Agent能力提升同步擴展的管控體系。
驅動當今Agent的模型非常強大。它們能夠跨越複雜問題進行推理,規劃多步驟工作流程,並生成精準細膩的回應。但大多數Agent的實際表現遠未達到這樣的潛力上限。差距不在於智慧,而在於取得正確的上下文和回饋。
負責解答企業退款政策問題的客服類Agent,若無法存取SharePoint中儲存的政策文件,便無法提供有效支援;撰寫市場簡報的研究類Agent,若無法取得訓練資料之外的即時資訊,輸出的內容便會存在缺失;財務顧問類Agent,若無法突破付費牆取得所需的即時市場資料,只能給出次等建議。而在所有場景下,多數團隊都缺乏系統化的方法,無法追蹤Agent部署後的效果優劣變化。
能力強大的模型僅僅是起點。讓Agent在生產環境中發揮效能的關鍵,在於使其能夠取得執行全部任務所需的一切:正確的知識、執行操作的資源以及持續改進的回饋迴圈。
Amazon Bedrock AgentCore上的Agent已獲得對三層知識的原生存取權,每層知識都拓寬Agent可以觸及和完成的範圍,包括由AgentCore託管的企業知識層、公共知識層以及付費知識層。
企業最有價值的資訊散佈在SharePoint、Google Drive、Confluence、Amazon S3和內部wiki等地方。傳統方式下,要讓Agent能夠使用這些資訊,需要建造客製化的資料導入管道、優化檢索效果,並長期維護資料的時效性。往往需要耗費數月的工程開發工作,Agent才能回答與企業自身業務相關的基礎問題。
目前已在AgentCore上線的Amazon Bedrock Managed Knowledge Base(託管知識庫),可以代替上述工作。企業只需導入自身的非結構化資料來源,其餘工作都由AgentCore處理。平台管理向量儲存、檢索期間使用的嵌入和重排序模型,以及速率限制等擴展性問題,因此團隊可以專注於建構Agent,而不是營運資料管道。該功能的核心是遠超傳統檢索增強生成(RAG)的Agentic檢索器。它不是將查詢與最接近的文本片段做配對,而是跨企業的知識庫規劃查詢,連接各個文件中的相關概念,評估中間結果,並在回答之前進行重新排序。對於同時涉及多個主題的複雜多意圖查詢,Agentic檢索的資訊覆蓋廣度與完整度,明顯優於基礎檢索方式。
內部知識存在局限性。法規不斷更新,市場持續變化,競爭對手也在不斷推出新產品。要讓Agent發揮最佳作用,就需要掌握企業外部的即時動態,以支援研究、事實核查、客戶服務、市場情報分析等工作。現在,AWS為建構AI Agent的開發人員推出Web Search這個新工具。它提供來自網路的資訊,同時將資料保留在客戶安全的AWS環境中。
Web Search基於AWS統一的搜尋基礎設施建構,該架構同時支援AIexa+、Amazon Quick Suite與Kiro等產品;它針對Agentic檢索進行優化,回傳的高價值內容能提高每單位Token的智慧密度。它還採用多源事實定錨方案,將公共網路資訊與AWS專有的知識圖譜相結合。該圖譜融合結構化的實體資料、經過驗證的事實以及股票價格和體育比分等即時資訊。


Web Search將用戶的查詢保留在AWS安全和合規邊界內,無須引入額外的供應商,也沒有隨之而來的編排、身份驗證或計費工作流程。無論企業是在建構交叉引用公共來源的研究Agent,監控法規和政策更新的合規Agent,還是利用最新資訊定錨模型回應,Agent現在都可以像查詢內部知識一樣對即時網路資訊進行推理。
最好的資訊並不總是免費的,例如:金融市場動態、授權研究、專屬資料集、付費API。如果Agent無法讀取付費資源,它將提供次優的答案,而用戶永遠不知道錯過了什麼。
讀取付費內容需要兩個部分:Agent端需要支付能力,而供應商端則需要收費機制。上個月推出的Amazon Bedrock AgentCore支付功能因應Agent端的需求,讓Agent能夠在執行週期中發現付費服務和內容、進行支付並讀取它們。現在,正式可用的AWS WAF AI流量變現功能則因應供應商端的需求,使內容擁有者能控制Agent存取權限:可選擇阻擋、放行或收費。由於這兩種功能都在同一個平台上執行,使用AWS WAF的供應商會自動辨識在Amazon Bedrock AgentCore上驗證的Agent。最終形成一個可信任的管道:經過驗證的Agent享有更低的導入阻力,內容提供方則取得相應報酬。這兩項能力共同建構Agent經濟雙邊基礎設施,讓Agent能夠接觸所有資訊——而不僅僅是那些恰好免費的內容。
提升Agent的知識取得能力只是問題的一方面。企業還需要了解Agent是否真正達成目標,並在表現不佳時及時發現問題。
這聽起來容易做起來難。最危險的Agent故障不是那些拋出錯誤的故障,而是那些在儀表板上看起來正常的故障:一個對未執行過的訂單修改發出確認的Agent,一個在API超時時宣稱產品可用的Agent,或者另一個跳過審核步驟,但在儀表板上顯示99%成功率的Agent。這些故障不會產生錯誤訊號。它們在幾週後透過客戶投訴暴露出來,此時通常已影響了數千個對話。即便團隊察覺到問題,修復工作也大多依賴猜測:調整提示詞、修改工具描述、微調編排邏輯,最後只能寄望改動奏效,沒有系統化的方法可以驗證改動是否確實優化,還是悄悄引發其他問題。
現在,AWS宣布Amazon Bedrock AgentCore推出全新的優化功能,將生產追蹤轉化為持續改進。這些功能共同形成一個迴圈:理解Agent的實際行為,生成資料驅動的修復方案,於部署前進行驗證,並確認實際成效。
理解Agent的行為:Insight洞察功能現已提供預覽版,AgentCore可在數百個對話中提供豐富的故障、意圖和軌跡洞察,揭露任何儀表板或逐筆追蹤審查都無法發現的模式。故障洞察可以發現重複發生故障的模式,例如不觸發錯誤訊號的隱性行為失效,詳細解釋每個故障的根本原因,並根據影響範圍排序,進而使人能一眼看出哪些問題對使用者的影響最大並優先修復。意圖洞察可以根據使用者的實際意圖對請求分群,進而能看到Agent的真實使用情形。軌跡洞察將Agent完成任務的執行路徑進行分組,以便能夠發現常見模式和異常值。可以透過每日或每週報告啟用持續監控,或者在部署後或投訴遽增時進行針對性分析,在幾分鐘內即可獲得結果。
充滿信心地修復:一旦知道要更改什麼,正式可用的建議功能和A/B測試功能將幫助團隊採取行動。建議功能透過分析追蹤和評估輸出,依據Agent實際行為對系統提示詞和工具描述提出具體改進建議。
能力越強的Agent意味著越大的攻擊面。而且Agent帶來傳統軟體從未有過的安全挑戰:它們是機率性的。Agent會做出判斷,而判斷可以被上下文影響。新的風險暴露點不再是網路,而是Agent的上下文,提示詞注入和記憶投毒不需要入侵系統,只需要說服Agent做出一個錯誤判斷。

安全保障機率性事物的方法是使用確定性的事物:不是作為大腦,而是作為周圍的護欄。Amazon Bedrock AgentCore中的Policy策略功能已於閘道處提供即時的確定性控制,定義Agent對企業工具與資料的使用權限。現在,AWS透過Amazon Bedrock Guardrails整合擴展這些功能,並已正式可用,它會評估每個Agent操作以防止提示詞注入嘗試、有害內容和敏感資料洩露。這些檢查在閘道層執行,在Agent程式碼之外,Agent無法在其上下文中看到它們,無法在推理時繞過它們,也無法說服自己它們不適用。
Agent不只是一個模型。如果模型是大腦,那麼Harness執行環境就是支持大腦完成工作所需的身體。它執行編排循環、調用工具、管理上下文視窗、跨輪次保持狀態、從故障中恢復並隔離每個對話。Harness對Agent效能表現的影響與模型同樣重要。建構一個穩健的Harness是目前大多數團隊花費最多時間的地方。
現已正式可用的Amazon Bedrock AgentCore harness為企業提供執行環境層的託管功能。無須為整個執行流程編寫程式碼,而是透過配置來定義Agent:其使用的模型、調用的工具、可以讀取的技能以及遵循的指令。AgentCore會動態組裝並驅動這個執行流程。透過該單一配置,企業可以在幾分鐘內獲得一個在自身隔離環境中執行的、可工作的Agent。它配備檔案系統和Shell、跨對話的記憶、Skills(包含AWS官方精選的Skills目錄),以及網頁瀏覽功能。這並不是一個會隨著業務規模擴大而淘汰的初學者工具:開始時使用的配置就是大規模營運時使用的配置,當需要自訂編排時,可以將Harness匯出為程式碼並保持在相同的平台上,而無須重新建立任何內容。
除了速度,它真正釋放的是市場上前所未有的選擇自由。目前可用的Harness方案都會讓企業被綁定在某個環節:開源方案需要自行託管和維運Harness;託管服務會將企業鎖定在它們的環境中;模型廠商提供的Harness則只針對自家模型優化。而AWS將Harness與模型解除綁定,讓企業可以選擇任意模型,甚至在對話中途切換,而無須改動Agent邏輯。
選擇只是一部分。由於Harness是單一平台的一個組成部分,而不是包裹在框架周圍的託管層,因此它在調用工具時,都會透過同一個閘道進行分派——該閘道不僅強力執行安全性原則,同時也將Agent連接至企業知識、網路資訊和付費知識。身份、記憶和可觀測性都來自這同一個平台,因此Agent採取的每項操作都從第一次調用開始受到治理和追蹤,無須額外的線路連接。企業在第一天宣告的Agent就是第一千天執行的Agent,自始至終建立在相同的基礎之上。