Amazon Bedrock AgentCore 重磅更新：幫助企業打造具有更廣闊知識和持續學習能力的 Agent

Amazon Web Services（AWS）宣布，專注於Agent建構、連接與優化的一站式平台Amazon Bedrock AgentCore推出多項新功能，幫助企業加速打造具有更廣闊知識和持續學習能力的Agent。這些新功能將能夠整合Agent與企業內部知識、公開網路知識及付費知識資源，助力技術團隊快速定位、修復生產環境中的故障問題，並建置隨Agent能力提升同步擴展的管控體系。

驅動當今Agent的模型非常強大。它們能夠跨越複雜問題進行推理，規劃多步驟工作流程，並生成精準細膩的回應。但大多數Agent的實際表現遠未達到這樣的潛力上限。差距不在於智慧，而在於取得正確的上下文和回饋。

負責解答企業退款政策問題的客服類Agent，若無法存取SharePoint中儲存的政策文件，便無法提供有效支援；撰寫市場簡報的研究類Agent，若無法取得訓練資料之外的即時資訊，輸出的內容便會存在缺失；財務顧問類Agent，若無法突破付費牆取得所需的即時市場資料，只能給出次等建議。而在所有場景下，多數團隊都缺乏系統化的方法，無法追蹤Agent部署後的效果優劣變化。

能力強大的模型僅僅是起點。讓Agent在生產環境中發揮效能的關鍵，在於使其能夠取得執行全部任務所需的一切：正確的知識、執行操作的資源以及持續改進的回饋迴圈。

Amazon Bedrock AgentCore上的Agent已獲得對三層知識的原生存取權，每層知識都拓寬Agent可以觸及和完成的範圍，包括由AgentCore託管的企業知識層、公共知識層以及付費知識層。

企業最有價值的資訊散佈在SharePoint、Google Drive、Confluence、Amazon S3和內部wiki等地方。傳統方式下，要讓Agent能夠使用這些資訊，需要建造客製化的資料導入管道、優化檢索效果，並長期維護資料的時效性。往往需要耗費數月的工程開發工作，Agent才能回答與企業自身業務相關的基礎問題。

目前已在AgentCore上線的Amazon Bedrock Managed Knowledge Base（託管知識庫），可以代替上述工作。企業只需導入自身的非結構化資料來源，其餘工作都由AgentCore處理。平台管理向量儲存、檢索期間使用的嵌入和重排序模型，以及速率限制等擴展性問題，因此團隊可以專注於建構Agent，而不是營運資料管道。該功能的核心是遠超傳統檢索增強生成（RAG）的Agentic檢索器。它不是將查詢與最接近的文本片段做配對，而是跨企業的知識庫規劃查詢，連接各個文件中的相關概念，評估中間結果，並在回答之前進行重新排序。對於同時涉及多個主題的複雜多意圖查詢，Agentic檢索的資訊覆蓋廣度與完整度，明顯優於基礎檢索方式。

內部知識存在局限性。法規不斷更新，市場持續變化，競爭對手也在不斷推出新產品。要讓Agent發揮最佳作用，就需要掌握企業外部的即時動態，以支援研究、事實核查、客戶服務、市場情報分析等工作。現在，AWS為建構AI Agent的開發人員推出Web Search這個新工具。它提供來自網路的資訊，同時將資料保留在客戶安全的AWS環境中。

Web Search基於AWS統一的搜尋基礎設施建構，該架構同時支援AIexa+、Amazon Quick Suite與Kiro等產品；它針對Agentic檢索進行優化，回傳的高價值內容能提高每單位Token的智慧密度。它還採用多源事實定錨方案，將公共網路資訊與AWS專有的知識圖譜相結合。該圖譜融合結構化的實體資料、經過驗證的事實以及股票價格和體育比分等即時資訊。

Web Search將用戶的查詢保留在AWS安全和合規邊界內，無須引入額外的供應商，也沒有隨之而來的編排、身份驗證或計費工作流程。無論企業是在建構交叉引用公共來源的研究Agent，監控法規和政策更新的合規Agent，還是利用最新資訊定錨模型回應，Agent現在都可以像查詢內部知識一樣對即時網路資訊進行推理。

最好的資訊並不總是免費的，例如：金融市場動態、授權研究、專屬資料集、付費API。如果Agent無法讀取付費資源，它將提供次優的答案，而用戶永遠不知道錯過了什麼。

讀取付費內容需要兩個部分：Agent端需要支付能力，而供應商端則需要收費機制。上個月推出的Amazon Bedrock AgentCore支付功能因應Agent端的需求，讓Agent能夠在執行週期中發現付費服務和內容、進行支付並讀取它們。現在，正式可用的AWS WAF AI流量變現功能則因應供應商端的需求，使內容擁有者能控制Agent存取權限：可選擇阻擋、放行或收費。由於這兩種功能都在同一個平台上執行，使用AWS WAF的供應商會自動辨識在Amazon Bedrock AgentCore上驗證的Agent。最終形成一個可信任的管道：經過驗證的Agent享有更低的導入阻力，內容提供方則取得相應報酬。這兩項能力共同建構Agent經濟雙邊基礎設施，讓Agent能夠接觸所有資訊——而不僅僅是那些恰好免費的內容。

提升Agent的知識取得能力只是問題的一方面。企業還需要了解Agent是否真正達成目標，並在表現不佳時及時發現問題。

這聽起來容易做起來難。最危險的Agent故障不是那些拋出錯誤的故障，而是那些在儀表板上看起來正常的故障：一個對未執行過的訂單修改發出確認的Agent，一個在API超時時宣稱產品可用的Agent，或者另一個跳過審核步驟，但在儀表板上顯示99%成功率的Agent。這些故障不會產生錯誤訊號。它們在幾週後透過客戶投訴暴露出來，此時通常已影響了數千個對話。即便團隊察覺到問題，修復工作也大多依賴猜測：調整提示詞、修改工具描述、微調編排邏輯，最後只能寄望改動奏效，沒有系統化的方法可以驗證改動是否確實優化，還是悄悄引發其他問題。

現在，AWS宣布Amazon Bedrock AgentCore推出全新的優化功能，將生產追蹤轉化為持續改進。這些功能共同形成一個迴圈：理解Agent的實際行為，生成資料驅動的修復方案，於部署前進行驗證，並確認實際成效。

理解Agent的行為：Insight洞察功能現已提供預覽版，AgentCore可在數百個對話中提供豐富的故障、意圖和軌跡洞察，揭露任何儀表板或逐筆追蹤審查都無法發現的模式。故障洞察可以發現重複發生故障的模式，例如不觸發錯誤訊號的隱性行為失效，詳細解釋每個故障的根本原因，並根據影響範圍排序，進而使人能一眼看出哪些問題對使用者的影響最大並優先修復。意圖洞察可以根據使用者的實際意圖對請求分群，進而能看到Agent的真實使用情形。軌跡洞察將Agent完成任務的執行路徑進行分組，以便能夠發現常見模式和異常值。可以透過每日或每週報告啟用持續監控，或者在部署後或投訴遽增時進行針對性分析，在幾分鐘內即可獲得結果。

充滿信心地修復：一旦知道要更改什麼，正式可用的建議功能和A/B測試功能將幫助團隊採取行動。建議功能透過分析追蹤和評估輸出，依據Agent實際行為對系統提示詞和工具描述提出具體改進建議。

能力越強的Agent意味著越大的攻擊面。而且Agent帶來傳統軟體從未有過的安全挑戰：它們是機率性的。Agent會做出判斷，而判斷可以被上下文影響。新的風險暴露點不再是網路，而是Agent的上下文，提示詞注入和記憶投毒不需要入侵系統，只需要說服Agent做出一個錯誤判斷。

安全保障機率性事物的方法是使用確定性的事物：不是作為大腦，而是作為周圍的護欄。Amazon Bedrock AgentCore中的Policy策略功能已於閘道處提供即時的確定性控制，定義Agent對企業工具與資料的使用權限。現在，AWS透過Amazon Bedrock Guardrails整合擴展這些功能，並已正式可用，它會評估每個Agent操作以防止提示詞注入嘗試、有害內容和敏感資料洩露。這些檢查在閘道層執行，在Agent程式碼之外，Agent無法在其上下文中看到它們，無法在推理時繞過它們，也無法說服自己它們不適用。

Agent不只是一個模型。如果模型是大腦，那麼Harness執行環境就是支持大腦完成工作所需的身體。它執行編排循環、調用工具、管理上下文視窗、跨輪次保持狀態、從故障中恢復並隔離每個對話。Harness對Agent效能表現的影響與模型同樣重要。建構一個穩健的Harness是目前大多數團隊花費最多時間的地方。

現已正式可用的Amazon Bedrock AgentCore harness為企業提供執行環境層的託管功能。無須為整個執行流程編寫程式碼，而是透過配置來定義Agent：其使用的模型、調用的工具、可以讀取的技能以及遵循的指令。AgentCore會動態組裝並驅動這個執行流程。透過該單一配置，企業可以在幾分鐘內獲得一個在自身隔離環境中執行的、可工作的Agent。它配備檔案系統和Shell、跨對話的記憶、Skills（包含AWS官方精選的Skills目錄），以及網頁瀏覽功能。這並不是一個會隨著業務規模擴大而淘汰的初學者工具：開始時使用的配置就是大規模營運時使用的配置，當需要自訂編排時，可以將Harness匯出為程式碼並保持在相同的平台上，而無須重新建立任何內容。

除了速度，它真正釋放的是市場上前所未有的選擇自由。目前可用的Harness方案都會讓企業被綁定在某個環節：開源方案需要自行託管和維運Harness；託管服務會將企業鎖定在它們的環境中；模型廠商提供的Harness則只針對自家模型優化。而AWS將Harness與模型解除綁定，讓企業可以選擇任意模型，甚至在對話中途切換，而無須改動Agent邏輯。

選擇只是一部分。由於Harness是單一平台的一個組成部分，而不是包裹在框架周圍的託管層，因此它在調用工具時，都會透過同一個閘道進行分派——該閘道不僅強力執行安全性原則，同時也將Agent連接至企業知識、網路資訊和付費知識。身份、記憶和可觀測性都來自這同一個平台，因此Agent採取的每項操作都從第一次調用開始受到治理和追蹤，無須額外的線路連接。企業在第一天宣告的Agent就是第一千天執行的Agent，自始至終建立在相同的基礎之上。

情報資訊