小白程序员必看：掌握ACP协议，轻松接入AI编码助手（收藏备用）

最新推荐文章于 2026-05-20 00:30:00 发布

原创最新推荐文章于 2026-05-20 00:30:00 发布 · 517 阅读

8 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #架构 #数据库 #大模型 #大模型学习

ACP协议为AI编码助手与编辑器之间的通信提供了标准化方案，解决了多编辑器适配和安全性问题。本文介绍了ACP的核心功能、通信模型、生命周期及SDK实现，帮助开发者快速理解和应用该协议，提升开发效率。

1. 为什么需要 ACP

AI 编码助手（Agent）正在快速发展，但生态存在一个结构性问题：N 款编辑器 × M 款 Agent = N×M 套适配方案。每一款 Agent 都需要为 VS Code、JetBrains、Zed 等编辑器分别开发插件，反之亦然。除了重复劳动，还有更深层的矛盾——Agent 若要修改文件或执行终端命令，要么由各编辑器自行实现一套私有 API，要么直接调用系统原生接口，绕过了编辑器的安全管控。

Agent Client Protocol (ACP) 的定位是为这一问题提供标准答案：一套开放的 JSON-RPC 契约，将编辑器（Client）与 AI 助手（Agent）解耦为独立的两端。Client 专注于 UI 渲染与本地资源管控，Agent 专注于 LLM 推理与任务编排，二者通过协议通信，互不侵入。

2. ACP 与 MCP 的边界

ACP 与 Model Context Protocol (MCP) 并非竞品，而是互补。ACP 规范的是 Client 与 Agent 之间的交互边界（任务下发、流式渲染、权限管控），MCP 规范的是 Agent 与外部数据源之间的工具边界（调用 GitHub API、查询数据库）。在 ACP 的初始化协商中，Agent 可以通过 mcpCapabilities 声明自身支持的 MCP 传输类型，由 Client 在创建会话时传入 MCP Server 配置，Agent 据此自行建立与外部工具的连接。

3. 通信模型

3.1 传输层：stdio

ACP 的传输层设计刻意保持极简。官方规范目前定义的主要传输机制是 stdio：Client 将 Agent 作为子进程启动，随即接管其 stdin / stdout 作为双向通信管道，消息采用 NDJSON 格式（每条 JSON-RPC 消息占一行，以 /n 分隔）。不需要端口分配，不需要 HTTP 握手，进程存活即连接存活。

这一选择的工程意义在于：Agent 可以用任意语言实现（Rust、Python、TypeScript），只要能读写标准流即可接入协议。

3.2 消息类型：Method 与 Notification

ACP 遵循 JSON-RPC 2.0 规范，将消息分为两类：

Method（请求-响应）：携带唯一 id，调用方挂起等待，对端必须返回 result 或 error。适用于需要确认结果的操作，如 session/prompt、fs/read_text_file、terminal/create。
Notification（单向通知）：不携带 id，发出即完成，无需响应。适用于高频的状态推送，如 session/update（流式输出）和 session/cancel（取消操作）。

这两类消息的区分，是理解 ACP 并发模型的关键。一次 Prompt Turn 中，Agent 可能同时挂起多个 Method 等待 Client 响应（如并发读取多个文件），同时持续发出 Notification 推送思考过程。Client 通过 id 将响应路由回对应的挂起请求，互不干扰。

4. 协议生命周期

一次完整的 ACP 交互从进程启动到对话结束，按时间线分为四个阶段：

4.1 初始化（Initialization）

Client 启动 Agent 子进程后，首先发送 initialize 请求，携带自身支持的协议版本和能力清单（Capabilities）。Agent 响应确认协议版本，并返回自身能力。

双方据此约束后续交互的边界。例如 Client 通过 fs.readTextFile / terminal 等字段声明可用的沙箱资源，Agent 通过 promptCapabilities（输入模态）、mcpCapabilities（MCP 传输类型）等字段声明自身能力。任何未声明的能力，对端必须视为不支持。

4.2 会话建立（Session Setup）

初始化完成后，Client 通过 session/new 创建会话，传入工作目录 cwd 和可选的 MCP Server 配置。Agent 返回一个 sessionId，后续所有交互都以此 ID 为上下文锚点。

4.3 Prompt Turn

Prompt Turn 是 ACP 中最核心的交互循环，其流程如下：

❝

上图为简化版流程，完整的 Prompt Turn 时序图（含取消、多轮工具调用等分支）见官方文档 Prompt Turn 章节。

梳理一下上图中涉及的几个关键机制：

流式推送。Agent 通过 session/update Notification 持续向 Client 推送中间状态：思考过程（agent_message_chunk）、执行计划（plan）、工具调用声明（tool_call）。Client 据此实时渲染 UI，无需等待最终结果。

权限拦截。当 Agent 需要执行敏感操作时，可通过 session/request_permission 向 Client 发起反向请求。Client 向用户弹出确认界面，将用户决策（allow_once / reject_once 等）序列化为响应返回。若被拒绝，Agent 应中断该工具调用并向用户说明原因。

沙箱资源调用。Agent 不直接操作文件系统或终端，而是通过 ACP 向 Client 借调：

fs/read_text_file：读取文件内容（包括编辑器中未保存的修改）
fs/write_text_file：写入文件
terminal/create：创建终端并执行命令，返回 terminalId
terminal/output / terminal/wait_for_exit：获取输出或等待命令完成
terminal/kill / terminal/release：终止命令并释放资源

终端的设计尤其值得注意：terminal/create 立即返回句柄（terminalId），命令在后台异步执行。Agent 可以并发创建多个终端，按需轮询输出，超时后通过 terminal/kill 强制终止。协议要求 Agent 在使用完毕后必须调用 terminal/release 释放资源。

Turn 结束。当 Agent 完成所有处理，对初始的 session/prompt 返回 Result，携带 stopReason（end_turn / max_tokens / cancelled 等），Turn 正式闭环。Client 可随即发起下一轮 session/prompt。

4.4 取消（Cancellation）

Client 可随时通过 session/cancel Notification 中断当前 Turn。Agent 收到后应尽快停止所有进行中的操作，并以 stopReason: "cancelled" 响应原始的 session/prompt 请求。协议明确要求 Agent 不得将取消作为错误返回——这是一个正常的业务语义，而非异常。

5. SDK 源码解析

ACP 官方提供了一个 TypeScript SDK（@agentclientprotocol/sdk），整个核心实现仅由三个文件构成，结构极为精简：

jsonrpc.ts（46 行）：定义 AnyRequest、AnyResponse、AnyNotification 三种 JSON-RPC 消息类型。
stream.ts（89 行）：实现 ndJsonStream 函数——将原始的 stdin/stdout 字节流转换为结构化的 ReadableStream<AnyMessage> / WritableStream<AnyMessage>，即逐行按 /n 分割并 JSON.parse。
acp.ts（约 2000 行）：协议的核心调度层，包含 Connection、AgentSideConnection、ClientSideConnection 三个类。

其中 Connection 类是整个 SDK 的调度中枢，其核心机制可以归纳为以下几点：

Pending Map 多路复用。Connection 内部维护了一个 #pendingResponses: Map<id, {resolve, reject}>，每次通过 sendRequest 发出请求时，自增 #nextRequestId 分配 ID，将对应的 Promise 回调挂入 Map 后写入管道。当 #receive 循环从流中读到响应时，通过 #handleResponse 按 id 匹配并唤醒对应的 Promise——这正是第 3.2 节所述的多路复用模型的落地实现。

消息三路分发。#processMessage 对收到的每条消息进行三路判定：

同时包含 method 和 id → 对方发来的 Request，调用 #requestHandler 处理后回传结果
仅包含 method → 对方发来的 Notification，调用 #notificationHandler 处理，不回传
仅包含 id → 对方回传的 Response，通过 #handleResponse 唤醒挂起的 Promise

方法路由。AgentSideConnection 在构造时注入一个 requestHandler，内部通过 switch(method) 将 session/prompt、session/new、initialize 等协议方法路由到 Agent 实现的对应函数。ClientSideConnection 则对称地路由 fs/read_text_file、terminal/create、session/request_permission 等 Client 侧方法。

断连清理。当底层流关闭或发生异常时，#close 方法会遍历 #pendingResponses 中所有未完成的 Promise 并 reject，确保不会出现永久挂起的请求泄漏。

6. 微内核实现

剥离所有业务逻辑后，ACP 的通信内核可以用不到 40 行 TypeScript 还原。其本质是一个基于 id 映射的异步多路复用器：

import { EventEmitter } from'events';

const pending = new Map<number, { resolve: Function; reject: Function }>();
let nextId = 1;
const bus = new EventEmitter();

// 发送 Request：挂起 Promise，等待对端按 id 回调
function sendRequest(method: string, params: any): Promise<any> {
returnnewPromise((resolve, reject) => {
    const id = nextId++;
    pending.set(id, { resolve, reject });
    process.stdout.write(JSON.stringify({ jsonrpc: '2.0', id, method, params }) + '/n');
  });
}

// 接收：按 id 路由 Response，按 method 分发 Notification/Request
process.stdin.on('data', (chunk) => {
for (const line of chunk.toString().split('/n').filter(Boolean)) {
    try {
      const msg = JSON.parse(line);
      if (msg.id != null && (msg.result !== undefined || msg.error)) {
        const p = pending.get(msg.id);
        if (p) {
          msg.error ? p.reject(msg.error) : p.resolve(msg.result);
          pending.delete(msg.id);
        }
      } elseif (msg.method) {
        bus.emit(msg.method, msg);
      }
    } catch {}
  }
});

无论官方 SDK 如何封装，底层的调度模型都是这个结构：发送端通过自增 id 挂起 Promise，接收端按 id 匹配并唤醒。Notification 因为没有 id，直接走事件分发，不占用挂起队列。这就是 ACP 能在单条 stdio 管道上实现全双工、多路复用的根本原因。

7. 结语

ACP 用一套简洁的 JSON-RPC 契约，解决了 AI 编码助手生态中编辑器与 Agent 之间的标准化通信问题。协议的核心设计可以归纳为三点：通过 Method/Notification 的二元消息模型实现无阻塞的异步流控；通过 fs/* 和 terminal/* 将系统资源的控制权收归 Client（沙箱化）；通过 session/request_permission 在工具调用前插入人工审批节点（安全拦截）。这三者共同构成了一个在性能、安全与可扩展性之间取得平衡的协议架构。

最后

对于正在迷茫择业、想转行提升，或是刚入门的程序员、编程小白来说，有一个问题几乎人人都在问：未来10年，什么领域的职业发展潜力最大？

答案只有一个：人工智能（尤其是大模型方向）

当下，人工智能行业正处于爆发式增长期，其中大模型相关岗位更是供不应求，薪资待遇直接拉满——字节跳动作为AI领域的头部玩家，给硕士毕业的优质AI人才（含大模型相关方向）开出的月基础工资高达5万—6万元；即便是非“人才计划”的普通应聘者，月基础工资也能稳定在4万元左右。

再看阿里、腾讯两大互联网大厂，非“人才计划”的AI相关岗位应聘者，月基础工资也约有3万元，远超其他行业同资历岗位的薪资水平，对于程序员、小白来说，无疑是绝佳的转型和提升赛道。

对于想入局大模型、抢占未来10年行业红利的程序员和小白来说，现在正是最好的学习时机：行业缺口大、大厂需求旺、薪资天花板高，只要找准学习方向，稳步提升技能，就能轻松摆脱“低薪困境”，抓住AI时代的职业机遇。

如果你还不知道从何开始，我自己整理一套全网最全最细的大模型零基础教程，我也是一路自学走过来的，很清楚小白前期学习的痛楚，你要是没有方向还没有好的资源，根本学不到东西！

下面是我整理的大模型学习资源，希望能帮到你。

请添加图片描述

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

1、大模型学习路线

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有，跟着老师学习事半功倍。

在这里插入图片描述

3、入门必看大模型学习书籍&文档.pdf（书面上的技术书籍确实太多了，这些是我精选出来的，还有很多不在图里）

在这里插入图片描述

4、 AI大模型最新行业报告

2026最新行业报告，针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。

5、面试试题/经验

【大厂 AI 岗位面经分享（107 道）】

【AI 大模型面试真题（102 道）】

【LLMs 面试真题（97 道）】

6、大模型项目实战&配套源码

适用人群

在这里插入图片描述

四阶段学习规划（共90天，可落地执行）

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

👇👇扫码免费领取全部内容👇👇

3、这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。
在这里插入图片描述