我們都在用 AI,但 AI 跟 AI 怎麼溝通?淺談 AI Agent 通訊協定
你有沒有想過,當我們每天使用的 AI 助手彼此之間要溝通時,它們用什麼語言? 現今 AI 技術已經非常先進,從聊天機器人協助寫作到語音助理幫忙安排行程,各式場域都有人應用導入,然而,這些 AI Agents 其實大多各做各的,很難互相合作,每個 AI…
我們都在用 AI,但 AI 跟 AI 怎麼溝通?淺談 AI Agent 通訊協定
Yang et al. “A Survey of AI Agent Protocols.” (2025) .
你有沒有想過, 當我們每天使用的 AI 助手彼此之間要溝通時,它們用什麼語言? 現今 AI 技術已經非常先進,從聊天機器人協助寫作到語音助理幫忙安排行程,各式場域都有人應用導入,然而,這些 AI Agents 其實大多各做各的,很難互相合作,每個 AI 系統都有自己的溝通方式,就像一座座孤島一樣。
這種情況就像早期網路剛出現時,各家電腦網路不相容,資訊無法流通,直到後來有了 TCP/IP 和 HTTP 這些通訊協定,大家才用同一套標準,讓全球網路真正連起來。現在 AI 世界也面臨同樣的關鍵時刻:我們需要讓 AI 之間「講同一種語言」。
為了解決 AI Agents 之間溝通不順的問題,各方開始研發「AI Agent 通訊協定」(Agent Communication Protocols),如果這些協定能像網路協定一樣成功標準化,未來就有機會打造一個智慧互聯網 — — 讓各種 AI 工具和代理無縫合作,發揮「1+1>2」的效果。想像一下,未來不同專長的 AI 可以臨時組隊解決複雜問題,工具型的 AI 可以同時支援多個 Agent,而且所有互動都基於同一套「語言」。這不僅能讓自動化更有效率,更可能創造出一種全新的分散式智慧合作模式,解決現在單一 AI 搞不定的難題。
為什麼需要 AI Agent 協定?現在的痛點在哪?
如前言所述,現在的 AI 生態系其實充滿溝通障礙,雖然 LLM 驅動的 AI Agent 很強大,但因為缺乏標準的通訊協定,它們很難順暢地和外部世界互動,如此會帶來幾個問題:
- 工具與資料存取的碎片化 : 不同 AI 廠商為了讓模型使用工具,各自設計了專屬介面或格式。例如,讓某個 AI 查天氣、另一個 AI 存取資料庫,可能要用不同的提示或 API。缺乏統一標準,開發者得為每個 AI 調整程式,增加很多麻煩和維護成本,就像每家公司電腦講不同方言,根本雞同鴨講。
- Agent 彼此協作困難 : 未來很多應用需要多個 AI Agent 一起工作(例如一個負責看圖、一個負責處理語言,合作完成任務),但現在不同來源或架構的 AI 很難直接溝通,各有各的溝通方式。這種問題讓跨平台的 AI 產品開發綁手綁腳,舉例來說,OpenAI 的 Agent 很難直接和 Google 的 Agent 對話,因為它們沒有共同語言。
- 難以擴充與升級 : 沒有標準協定就很難擴展,新工具或服務要接入 AI 系統時,得為不同 AI 客製整合,如果有統一協定,新功能就像插上通用插頭一樣簡單;沒有的話,每個都要個別調整,又慢又容易出錯。
什麼是 LLM Agent?它比傳統 AI 強在哪?
在深入討論各式協定之前,我們先來搞清楚 LLM Agent 是什麼。從字面上的意思就可知道,LLM Agent 是一種結合了 LLM 和自主行動能力的 AI 系統。它不只是被動回答問題,而是能像智能助理一樣主動規劃、決策、執行任務,之前有寫一篇關於 OpenManus 的應用 ,大家有興趣可以看看,而 LLM Agent 定義的核心能力主要包括:
- LLM 大腦 : LLM Agent 的核心是一個強大的基礎模型(像是 GPT-4 這類大型語言模型或多模態模型),相信大家對此應該已經不陌生了。
- 記憶機制 : 和一般一次性回答的模型不同,LLM Agent 有短期和長期記憶,短期記憶讓它在一次對話中記住上下文;長期記憶則累積過往重要資訊。所以它能越用越聰明,用之前的經驗幫你解決新問題。
- 自主規劃 : LLM Agent 擅長拆解任務,能把複雜工作分成一系列步驟。例如你讓它安排旅遊行程,它會自己分步驟查機票、訂飯店、排景點路線。這種規劃能力讓它做事更有條理,不會東一榔頭西一棒子。
- 工具使用 : 如遇到 LLM 本身的局限性,如數學計算或即時資訊等,LLM Agent 可以直接呼叫外部工具來補強。舉例來說,如果你問「明天紐約天氣如何?」,它會自動查天氣 API 來回答。這讓 Agent 像是有「外部大腦」,能查網路資料、用計算器、存取資料庫等等。
- 動作執行 : LLM Agent 還能實際執行動作,影響外部環境,例如透過 API 發郵件、在系統下指令等。這應該是最讓人映象深刻的事。
這 5 大能力讓 LLM Agent 像一個「會講話又會自動做事」的數位秘書,也正是因為如此,LLM Agent 被公認是 AI 領域的重大突破,也是 2025 年的趨勢之一。
但就上面談到的,要完全發揮這些能力,如何讓 Agents 互相合作才是關鍵,而這也正是我們需要「通訊協定」的原因。畢竟再厲害的 Agent,如果沒辦法順利取得資料或跟其他 Agent 配合,就很難處理更複雜的任務。
什麼是 AI Agent 協定?比傳統介面強在哪?
那甚麼是 AI Agent 協定(Agent Protocol)呢? 簡單來說這就是 AI Agents 彼此溝通、與外部系統互動時要遵守的遊戲規則,它確保不同廠牌、不同架構的 Agent 和工具都能無障礙溝通,你也可以把它想成AI界的「通用語」。
可能會有人問:「直接用現成的API、圖形介面(GUI)或傳統格式不行嗎?」確實,現在很多 AI 都是透過 API 呼叫工具,或是用網頁介面操作。但專門為AI設計的協定會有幾個明顯優勢:
- 效率更高 API 雖然快,但通常是為特定服務量身打造,彈性不足;GUI 雖然直觀但畢竟是設計給人用的,不適合 AI 之間高速傳輸。
- 跨平台通用 好的協定應該「到哪都能用」 — — 不管是在 Windows 還是 Linux、手機還是伺服器上跑。
- 為 AI 而生 現有的 HTML、XML 等格式本來是給瀏覽器或人類看的,AI 用起來會卡卡的,而 AI Agent 協定則完全根據其特性設計,不僅傳輸效率高,還能輕鬆擴充。比方說直接支援多媒體資料(文字+圖片+聲音)傳輸,這對未來 Agent 的多元溝通很重要,但傳統 API 往往做不到。
- 標準化優勢 統一規格對開發者來說超省事,就像學會 HTTP 協定就能連全世界網站,學會 Agent 協定就能讓 AI 串接各種工具,如此一來,資安管理也會更方便,能在協定層就建立安全防護機制,確保 AI 行為不會失控。
- 集體智慧潛力 最令人期待的是,協定讓 AI 組隊合作成為可能!當所有 Agent 都說同一種語言時,它們就能臨時組團、交換知識,甚至透過交流產生新的想法。
簡單說,有了 AI Agent 通訊協定,不同系統的AI能順暢組隊打怪,但目前各方積極開發各種協定,資訊有點混亂,因此接下來我們來整理有哪幾類協定。
協定怎麼分類? 四大類型一次看懂
為了搞清楚這個新興領域,研究者用兩個維度來分類:
第一個維度:溝通對象
- 情境導向(Context-Oriented): 專門處理 Agent 與外部工具/資源的溝通
- Agent間(Inter-Agent): 專門處理 Agent 與 Agent 的對話
第二個維度:應用範圍
- 通用型(General-Purpose):各行各業都能用
- 特定領域(Domain-Specific):專攻某個產業需求
Yang et al. “A Survey of AI Agent Protocols.” (2025) .
兩個維度交叉後,協定可分為四種類型:
- 情境導向 × 通用型 讓所有 AI Agent 都能用相同方式存取外部資源,例如 3 月時很火的 MCP(Model Context Protocol)讓不同 LLM Agent 都能用統一格式連接資料庫或 API。
- 情境導向 × 特定領域 專攻某個產業的資源存取需求,如:
- 網站專用的 agents.json 標準,讓 AI 更容易抓取網頁資訊(類似給 AI 看的robots.txt)
- 物聯網領域的 LMOS 協定,優化智能裝置與 AI 的溝通效率
- Agent 間 × 通用型 讓不同廠牌的AI能直接對話,不限應用場景,如:
- Google 4月提出的 A2A(Agent-to-Agent)
- 開源社群推動的ANP(Agent Network Protocol),目標打造「AI界的聯網標準」
- Agent 間 × 特定領域 針對特殊場景設計的 Agent 對話規則,如:
- PXP 協定:專門處理人類與 AI 代理的互動格式
- CrowdES 協定:聚焦機器人群體與 AI 的協調配合
透過這種分類法,我們能更清楚每種協定的定位:有些解決「AI怎麼用工具」,有些處理「AI怎麼組隊」;有些想當萬用標準,有些則走專業路線。接下來我們就來看看幾個當紅協定的實際應用案例。
重要協定一次看:MCP、A2A、ANP 如何打造 AI 溝通網路
如上所述,最近業界和學術界冒出超多種 AI Agent 協定,如雨後春筍,因此這邊我們挑幾個最有代表性的來看:
一、MCP(Model Context Protocol)| Anthropic(2024)
MCP 可以說是讓 AI Agent 對外取得資訊的第一代通用協定之一,它的目標很明確:讓各種 AI Agent 都能用同樣的方式連接資料庫、工具、服務這些 Agent 本身沒有的知識或能力來源。
MCP 訂了一套標準流程,讓 Agent 可以像呼叫遠端服務一樣取得需要的資訊,而且還有授權機制(MCP 結合了 RPC 呼叫和 OAuth 授權來確保安全)。MCP 的出現,大大解決了不同 AI 對接工具時格式亂七八糟的問題。
舉例來說,以前你可能要為 OpenAI 的 Agent 和 Anthropic 的 Agent 分別寫不同的指令讓它們查同一個資料庫,有了 MCP 之後,兩邊可以用同樣的協定來呼叫,這種碎片化的狀況就改善很多。同時,因為採用客戶端-伺服器架構,Agent 呼叫工具的過程和使用者最後拿到的回答是分開的,資料傳輸更安全(降低 AI 直接把敏感資料給使用者的風險)。
二、A2A(Agent-to-Agent)| Google 開發(2025)
隨著企業內部開始部署各種 AI Agent,Google 4 月也推出了 A2A 來讓企業環境下的多個 Agent 能夠無縫合作,A2A 的設計理念就是簡單實用,它強調重用現有的網路標準,像是用 HTTP(S) 當傳輸層、採用 JSON-RPC 2.0 當訊息格式,還用 Server-Sent Events(SSE)來支援即時串流。
因為站在巨人的肩膀上,A2A 的學習和實作門檻超低,熟悉網路開發的人很容易就能上手。且 A2A 天生就支援非同步任務和長時間的工作流程,舉例來說,在一個複雜任務中,Agent 可以發起子任務,透過 A2A 保持溝通(像是定期檢查進度、接收即時更新),這對於需要人類審核回饋的多回合流程也很適用。
另外,A2A 是多模態無關(Modality Agnostic)的,可以傳遞文字、檔案、影音甚至內嵌框架等各種內容,這點超級重要,因為 Agent 合作時常常需要交換圖片、音訊這類資訊。簡而言之,A2A 目標是成為 AI 代理之間的通用橋樑,特別適合企業內部的複雜場景,在確保安全和治理的前提下,讓不同來源的 Agent 能像同事一樣順暢協作。
三、ANP(Agent Network Protocol)| 開源社群推動(2024)
如果說 MCP 和 A2A 分別代表工具互通和企業內互通的努力,那 ANP 的目標就是打造一個真正開放的「Agent 網際網路」。ANP 背後是由 ANP Community 在推動,帶著去中心化的理想,這個協定用了語意網路的相關技術(像是 JSON-LD 格式、去中心化身份 DID 等)來表示 Agent 和它們的能力,目標是讓任何平台的 Agent 都能找到彼此、信任彼此並且交流。
想像未來可能會有一個公共的 Agent 網路,就像現在的網際網路一樣,而 ANP 就是希望成為這個網路的共同語言。由於 ANP 強調跨領域跨平台的互通,因此其也被用在跨領域協作的場合,如不同行業的 AI 系統(醫療 AI、金融 AI 等)可以透過 ANP 分享資訊,一起做決策。
雖然 ANP 還在發展初期,但它描繪的藍圖非常有遠見,這是一個沒有一家巨頭壟斷,而是一個去中心化的 AI Agent 生態,每個 Agent 都是網路的一份子,按需求組隊完成任務,這讓人想到網路標準剛出現時,那種開放自由的精神。
還有許多協定這邊就不提了,預估未來隨著大家都意識到 AI 溝通標準的重要性,紛紛投入資源找最佳解,協定會由百花齊放收斂整合,而在這過程中,如何評估協定的好壞便會成為很重要的指標。
好的協定長怎樣?評估關鍵指標
面對這麼多協定,我們需要一些標準來評估它們的優劣,以下是我蒐集的幾個關鍵指標:
- 效率(Efficiency) :協定的溝通成本夠低嗎?傳輸速度夠快嗎?在大量訊息交換時還能保持高效嗎?
- 安全性(Security) :協定如何確保資料安全和存取控制?有沒有內建身份驗證和授權機制?
- 擴展性(Scalability) :當 Agent 數量從十個暴增到成千上萬時,協定還能穩定運作嗎?
- 可靠性(Reliability) :協定溝通穩定嗎?在網路不穩時還能保持服務嗎?
- 互通性(Interoperability) :不同系統、框架的 Agent 真的能透過協定無縫合作嗎?
- 延展性(Extensibility) :協定能隨需求改良、新增功能而不影響舊系統嗎?
- 可操作性(Operability) :協定容易實作、部署和維護嗎?文件完不完整?
當然,不是所有場景都需要最頂尖的指標,有時候需要取捨。
結論
現在的 AI Agent 通訊協定生態,就像 90 年代初的網路標準競爭一樣百家爭鳴,且前景未定,但可以確定的是,隨著 AI 應用爆炸性成長,協定的重要性只會越來越高。
1. 短期來看(未來 1–2 年) :我們會看到更多企業和組織加入制定協定的行列,各種協定可能會互相競爭,但實踐會很快告訴我們哪些設計可行、哪些不行,而這之中安全與隱私會是很重點的領域。
2. 中期(未來 3–5 年): 隨著優秀的協定脫穎而出,完整的生態系會逐漸建立,協定不再只是技術規範,而是會圍繞它出現管理組織、測試套件、開發者社群,甚至應用市場。
3. 長期(5 年以上): 如果一切順利,我預估 AI Agent 協定最終會走向融合統一,或至少形成少數幾個主流標準。到時,我們可能會擁有一個真正的Agent Internet,在這個網路上,新的方法體系會湧現,不同 AI 透過協定組成一個分散式大腦,解決複雜問題的能力將遠遠超過單一 AI。
參考文獻
Anthropic. (2024) . Model context protocol . https://www.anthropic.com/news/model-context-protocol
Google. (2025) . A2A: Agent2Agent protocol . GitHub. https://github.com/google/A2A
Yang, Y., Chai, H., Song, Y., Qi, S., Wen, M., Li, N., Liao, J., Hu, H., Lin, J., Chang, G., Liu, W., Wen, Y., Yu, Y., & Zhang, W. (2025) . A Survey of AI Agent Protocols.
Yang, Y., Peng, Q., Wang, J., & Zhang, W. (2024) . LLM-based Multi-Agent Systems: Techniques and Business Perspectives.