随着大型语言模型(LLM)能力的指数级增长,智能体(Agent)应用正呈现爆发式增长。然而,其普及化面临一个严峻挑战:互操作性。这已成为制约构建复杂、跨领域智能系统的关键瓶颈。

我们都知道,MCP协议推动了智能体与工具(Tools)之间的集成,解决了数据孤岛问题。但在智能体领域,类似的孤岛现象同样存在。不同企业或组织构建的智能体,往往采用异构的技术框架和栈,加之自身安全策略的考量,极易形成彼此隔离的“孤岛”。这些孤岛之间缺乏标准化的通信与协作机制,限制了智能体生态的进一步发展。正是在此背景下,谷歌主导推出了A2A协议。
A2A协议是什么?
2025年4月9日,谷歌推出了A2A(Agent-to-Agent)协议。这是一种专注于智能体间交互与协作的开放协议。它允许不同来源、采用不同技术栈的智能体相互沟通,安全地交换信息,并协同执行复杂任务。A2A的核心目标就是打破系统孤岛,提升智能体的跨平台协作能力。
A2A得到了谷歌以及超过50家技术合作伙伴的支持,包括Atlassian、Salesforce和SAP等业界巨头,其目标直指企业级AI Agent的互操作性问题。基于A2A协议,智能体世界有望建立起统一的“公约”,让所有智能体能在通用的公共规则下进行无缝通信。

A2A协议核心概念简介
核心角色
A2A协议中定义了三个核心参与者:
- User(用户):最终发起任务的实体,可以是人类或服务。
- Client(客户端):代表用户与远程Agent交互的应用、服务或中间Agent。
- Remote Agent(远程智能体):负责执行任务的黑盒智能体,即A2A Server。

用户的主要作用在于认证和授权。客户端与服务器之间基于请求-响应模式进行通信,在A2A协议中这种交互表现为“任务”。值得注意的是,一个智能体既可以充当客户端,也可以充当服务器。
核心实体与概念

AgentCard
在人类社会中,我们用身份证来标识个体。在智能体的世界里,这个身份标识就是 AgentCard。它定义了智能体本身,通过表述其身份ID、提供的能力、支持的认证机制等信息,来表明“我是谁,我能做什么”。客户端智能体(Client Agent)通过服务器端智能体(Server Agent)提供的AgentCard,来了解不同服务器的身份和能力,从而决定具体任务应该交由哪个服务器来执行。
Task
Task 是一个具有状态的实体,用于达到特定的目标或结果。它由客户端智能体创建,其状态由服务器端智能体维护。在Task的执行过程中,客户端和服务器端通过交换Message来协作。
- Task实体具有状态机。
- 每个Task由一个唯一的
sessionId标识。多个Task可以共享同一个会话ID,表明它们属于同一个更广泛的会话上下文。
Artifacts
Artifact 是服务器端智能体在执行任务后生成的目标结果。一个Task可能会生成一个或多个Artifact。
Message & Part
在Task执行过程中,服务器端和客户端智能体之间通过 Message 完成信息交互(注意,Message本身不包含Artifact)。它可以包含智能体的思考、用户上下文、指令、错误、状态或元数据等信息。
Part 是Message和Artifact的核心组成部分,表述了其携带的主要内容。每个Part都标识了内容类型(如文本、文件、数据)和具体内容。
通信机制
客户端智能体与服务器端智能体之间基于经典的C/S(客户端/服务器)模式,通过HTTP协议进行通信。协议支持SSE(Server-Sent Events)流式数据传输,数据格式遵循JSON-RPC 2.0规范。A2A遵循Open API规范进行身份验证,但身份信息本身不在协议载荷中交换,而是通过HTTP Header进行携带和传输。
A2A 与 MCP:是竞争还是协同?
简单来说,MCP强调的是以LLMs/Agent为主体、MCP Server为附属的集成模式,主要解决智能体与外部工具和资源连接的问题。而A2A则专注于解决智能体与智能体之间的互操作问题。

因此,MCP与A2A并非竞争关系,而是相辅相成、具有同等重量级影响力的两大协议。它们共同致力于提升智能体的内外协作能力,使其能够更好地完成复杂任务,携手构建更完善的AI智能体协作生态。

结语
当前人工智能领域概念和技术层出不穷,容易让人望而生畏。理解智能体的本质,如果仅从纯技术视角出发可能稍显枯燥。不妨切换到更贴近人类思维的视角,也许认识会更加清晰。
从人类社会来看,每个人类个体就是一个典型的智能体,具备自身的能力和资源,并通过彼此交互,构建出更庞大的“模块”,最终组成了复杂的人类社会系统。A2A协议本质上解决的就是“数字智能体”间的“互操作”问题,好比为我们提供了统一的人类语言和社交机制,来促进人与人之间的交流与协作。
相比于人类社会的复杂性与多样性,智能体世界的协同也许更容易在统一的规则和机制下进行,这为我们构建一个更为高效、理想化的智能体协作世界提供了可能。