E2B沙箱：AI时代安全执行不可信代码的隔离环境实践

原创于 2026-06-29 15:35:33 发布 · 155 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#E2B沙箱 #代码安全执行 #容器隔离

kafka 同时被 2 个专栏收录

34 篇文章

订阅专栏

storm

11 篇文章

订阅专栏

1. 项目概述：为什么我们需要一个“代码牢笼”？

最近在折腾AI编程助手和智能体（Agent）时，一个绕不开的痛点越来越明显：如何安全地执行AI生成的、来源未知的代码？无论是让AI帮你写个数据处理脚本，还是构建一个能自动调用外部工具的智能体，你都无法百分百信任它生成的每一行代码。它可能无意中写了个死循环耗尽你的CPU，或者更糟，执行了 rm -rf / 这样的危险命令。这让我开始深入研究一个专门解决这个问题的技术——E2B（Environment-to-Browser）沙箱。

简单来说，E2B沙箱就是一个在云端为你瞬间创建、用完即焚的隔离代码执行环境。你可以把它想象成一个一次性的、高度安全的“代码牢笼”。你把一段不信任的代码（比如AI生成的Python脚本）丢进去，沙箱会在一个与你的主机完全隔离的容器里运行它，并将结果（标准输出、错误、生成的文件）安全地返回给你。整个过程，你的本地机器毫发无伤。

这不仅仅是AI时代的专属需求。想想这些场景：在线编程教育平台需要安全运行学生提交的代码；SaaS平台允许用户上传自定义函数（Function as a Service）；安全团队需要动态分析可疑脚本的行为。E2B提供的正是这种安全、弹性的代码执行能力。它通过巧妙的架构，将容器技术的隔离性与Web API的易用性结合，让安全执行外部代码变得像调用一个HTTP接口一样简单。接下来，我们就深入它的技术内核，并手把手带你搭建和使用它。

2. E2B沙箱核心技术原理拆解

要理解E2B，不能只停留在“它是一个云容器”的层面。它的设计精妙之处在于如何平衡安全、性能与易用性。其核心架构可以分解为以下几个层面。

2.1 隔离基石：容器与内核级安全

E2B的底层隔离依赖于容器技术，通常是Docker。但和普通的Docker容器不同，沙箱容器经过了严格的“瘦身”和“加固”。

深度裁剪的基础镜像 ：E2B的容器镜像并非完整的Linux发行版。它通常基于 scratch 或 alpine 等极简镜像构建，只包含运行代码所必需的最少库和工具（如Python解释器、Node.js运行时）。这极大减少了攻击面，那些可能被利用的非必要服务（如SSH、cron）根本不存在于镜像中。

内核能力（Capabilities）剥夺 ：即使容器逃逸（尽管概率极低）发生，攻击者能获得的权限也极其有限。通过Docker的 --cap-drop ALL 和 --cap-add 参数，沙箱容器在启动时就被剥夺了所有内核特权能力，然后按需添加极少数必要的（如 CHOWN , SETGID 等）。这意味着容器内的进程无法执行挂载文件系统、修改网络配置、加载内核模块等特权操作。

资源限额与命名空间隔离 ：这是容器的看家本领。每个沙箱容器都拥有独立的进程ID、网络、文件系统、用户等命名空间。更重要的是，严格的资源限制（Cgroups）是标配：

CPU ：限制使用份额（如 --cpus=0.5 ），防止挖矿脚本耗尽资源。
内存：硬性内存上限（如 --memory=256m ），并设置交换内存为0，一旦超限，进程会被OOM Killer立即终止。
运行时间 ：通过监控层设置超时（如30秒），防止无限循环。
文件系统 ：根文件系统通常以只读（ read-only ）模式挂载，仅在 /tmp 等特定目录提供可写空间，且空间大小受限。

注意：容器隔离并非绝对安全。在共享内核的架构下，理论上存在通过内核漏洞逃逸的风险。因此，E2B服务通常部署在独立的、专门用于运行不可信代码的物理或虚拟主机集群上，与核心业务服务器隔离，实现第二层防护。

2.2 执行控制与通信网关

容器准备好了，如何把代码送进去执行，并把结果拿出来？这就是E2B的“执行器（Executor）”和“通信层”要解决的问题。

执行器模式 ：E2B通常采用两种模式。一种是“预加载运行时”，容器内常驻一个轻量级的守护进程（比如用Go或Rust写的）。用户代码通过API发送到该守护进程，由它来 fork/exec 执行。另一种是“即时构建容器”，每次执行都从镜像创建一个新容器，通过 docker exec 来运行代码。前者延迟低，适合高频短任务；后者隔离性更强，每次都是全新环境。E2B的免费套餐多采用第一种模式以节约资源。

安全的输入/输出通道 ：这是通信的关键。代码和输入数据通过HTTPS API传入。在容器内部，执行器会将代码写入一个临时文件，然后重定向标准输入（stdin）、标准输出（stdout）和标准错误（stderr）。这些流会被执行器实时捕获，并通过WebSocket或长轮询（Long Polling）流式地传回客户端。这意味着你可以看到代码的实时打印输出，而不是等全部执行完。

文件系统交互 ：除了代码，用户可能需要上传数据文件或下载生成的结果。E2B会提供安全的文件上传/下载端点。上传的文件被放置在容器内的临时可写目录。执行完成后，允许用户通过特定API下载指定路径下的文件（如 /tmp/output.png ）。整个过程，容器内部无法访问到宿主机的任何敏感文件。

2.3 网络访问的“金丝雀笼”

允许沙箱内的代码访问外网，是一个高风险高需求的功能。E2B对此的处理非常谨慎。

默认禁止，按需开启 ：绝大多数情况下，沙箱容器启动时没有外部网络访问权限（ --network none ）。这彻底杜绝了代码进行网络扫描、发起DDoS攻击或泄露数据到外部的可能。

白名单制出站网络 ：当用户确实需要代码访问特定API（如调用某个公开的天气接口）时，可以在创建沙箱时指定网络策略。E2B服务会在主机层面通过防火墙（如iptables）或容器网络配置，只允许该容器访问特定的目标IP和端口。例如，只允许访问 api.openweathermap.org:443 。

完全无网络 ：对于代码评审、纯计算任务，最佳实践是禁用所有网络。这提供了最高级别的安全保证。

理解了这些原理，我们就能明白E2B不是一个简单的Docker封装，而是一个在便捷性、安全性和资源效率之间取得精妙平衡的系统工程。接下来，我们从理论走向实践。

3. 实战指南：从零开始集成E2B沙箱

理论说得再多，不如亲手跑一遍。这里我将以集成E2B的云服务（以其免费套餐为例）和自建简易沙箱两种方式，带你走通全流程。你会看到，为你的AI应用加上安全执行层，并没有想象中复杂。

3.1 方案一：使用E2B云服务（快速入门）

对于绝大多数应用场景，直接使用E2B提供的云服务是最快、最经济的选择。它省去了维护基础设施的麻烦。

3.1.1 获取密钥与初始化

首先，访问E2B官网注册账户。在控制台，你会找到你的API密钥。这个密钥是调用所有服务的凭证，务必像保管密码一样保管它，不要泄露在客户端代码中。

接下来，我们使用官方SDK进行初始化。这里以Node.js环境为例：

npm install e2b

// index.js
import { Sandbox } from 'e2b';

// 从环境变量读取API密钥，这是安全的最佳实践
const apiKey = process.env.E2B_API_KEY;
if (!apiKey) {
  throw new Error('请设置E2B_API_KEY环境变量');
}

// 创建一个Python沙箱实例
const sandbox = await Sandbox.create({
  // 指定模板ID，这里选择预置的Python3环境
  template: 'python3',
  apiKey,
});

console.log(`沙箱创建成功！ID: ${sandbox.id}`);
console.log(`沙箱状态: ${sandbox.status}`);
console.log(`访问终端: ${sandbox.getHostname()}`);

运行这段代码，几秒钟内，一个全新的、隔离的Python执行环境就在云端准备好了。 sandbox.id 是这个沙箱会话的唯一标识。

3.1.2 执行代码与获取输出

沙箱创建后，我们可以向里面发送代码并执行。

// 继续上面的代码
try {
  // 执行一段简单的Python代码
  const execution = await sandbox.runCode({
    code: `
import sys
print("Hello from E2B Sandbox!")
print(f"Python version: {sys.version}")
# 尝试做一些计算
result = sum([i*i for i in range(1, 11)])
print(f"1到10的平方和是: {result}")
    `,
    // 设置超时时间（毫秒）
    timeout: 10000,
  });

  console.log('--- 执行结果 ---');
  if (execution.error) {
    console.error('执行出错:', execution.error);
  } else {
    console.log('标准输出:');
    console.log(execution.stdout);
    console.log('标准错误:');
    console.log(execution.stderr);
    console.log(`退出码: ${execution.exitCode}`);
  }

} catch (error) {
  console.error('运行代码时发生错误:', error);
} finally {
  // 非常重要：使用完毕后关闭沙箱，停止计费
  await sandbox.close();
}

执行后，你会在控制台看到来自沙箱内部的打印信息。 finally 块中的 sandbox.close() 至关重要，因为E2B通常按沙箱的运行时长计费（免费套餐有额度），及时关闭能避免资源浪费。

3.1.3 文件操作与高级功能

除了运行代码，与沙箱内的文件系统交互也是常见需求。

// 写入文件到沙箱
const remoteFilePath = '/tmp/my_data.txt';
await sandbox.filesystem.write(remoteFilePath, '这是从外部写入沙箱的数据。\n第二行。');

// 从沙箱读取文件
const fileContent = await sandbox.filesystem.read(remoteFilePath);
console.log('读取到的文件内容:', fileContent);

// 执行一个读取该文件的Python脚本
const execution2 = await sandbox.runCode({
  code: `
with open('/tmp/my_data.txt', 'r') as f:
    content = f.read()
    print("文件内容如下：")
    print(content)
  `,
});
console.log(execution2.stdout);

对于更复杂的交互，比如需要安装额外的Python包，你可以在代码中直接使用 pip （前提是沙箱模板包含了pip和网络访问权限）。

const execution3 = await sandbox.runCode({
  code: `
import subprocess
import sys
# 在沙箱内安装requests包
subprocess.check_call([sys.executable, '-m', 'pip', 'install', 'requests'])
import requests
resp = requests.get('https://httpbin.org/get')
print(resp.json()['headers']['User-Agent'])
  `,
});

实操心得 ：使用云服务时，务必关注其免费额度的限制，例如每月总运行时间、并发沙箱数。在生产环境中，要将API密钥存储在环境变量或密钥管理服务中，绝不要硬编码在代码里。此外，虽然E2B处理了底层隔离，但你仍然需要对用户输入的代码（或AI生成的代码）进行上层校验，比如禁止导入某些危险模块（如 os.system , subprocess 的某些用法），这被称为“纵深防御”。

3.2 方案二：自建简易安全代码沙箱

如果你对数据主权、定制化有更高要求，或者想彻底理解其背后机制，可以尝试自建一个简易版的沙箱。这里我们使用Docker和Python的 docker 库来实现一个最核心的“执行不可信代码”的功能。

3.2.1 环境准备与Docker配置

首先，确保你的服务器安装了Docker Engine。然后，我们需要一个安全的、裁剪过的Docker镜像。这里以Python为例，创建一个 Dockerfile ：

# 使用超迷你Alpine Linux + Python
FROM python:3.11-alpine

# 切换到非root用户，降低权限
RUN addgroup -S sandbox && adduser -S sandbox -G sandbox
USER sandbox

# 设置工作目录
WORKDIR /home/sandbox

#  Alpine的包管理器apk安装一些基础工具，按需添加
# RUN apk add --no-cache gcc musl-dev linux-headers # 如需编译C扩展

# 复制一个简单的入口点脚本
COPY --chown=sandbox:sandbox entrypoint.py .

# 指定容器启动时执行的命令（我们的执行器）
CMD ["python", "entrypoint.py"]

对应的 entrypoint.py 是一个简单的执行器，它从标准输入读取代码并执行：

# entrypoint.py
import sys
import json
import traceback

def safe_execute():
    # 从标准输入读取执行请求（JSON格式）
    request_data = sys.stdin.read()
    try:
        request = json.loads(request_data)
        code = request.get('code', '')
        timeout = request.get('timeout', 30)
        
        # 这里可以添加额外的安全检查，比如黑名单模块
        forbidden_modules = ['os', 'subprocess'] # 示例：简单禁止，实际需更精细
        for mod in forbidden_modules:
            if f'import {mod}' in code or f'from {mod}' in code:
                return json.dumps({
                    'stdout': '',
                    'stderr': f'Forbidden module import detected: {mod}',
                    'exitCode': 1
                })
        
        # 使用exec在隔离的命名空间中执行代码
        # 注意：这仍然有一定风险，更安全的方式是使用pysandbox等库或ptrace
        # 这里仅为演示原理
        import io
        from contextlib import redirect_stdout, redirect_stderr
        stdout_capture = io.StringIO()
        stderr_capture = io.StringIO()
        
        try:
            with redirect_stdout(stdout_capture), redirect_stderr(stderr_capture):
                # 设置全局和局部的命名空间，限制访问
                restricted_globals = {'__builtins__': __builtins__} # 可进一步裁剪__builtins__
                exec(code, restricted_globals, {})
            exit_code = 0
        except Exception as e:
            stderr_capture.write(traceback.format_exc())
            exit_code = 1
            
        result = {
            'stdout': stdout_capture.getvalue(),
            'stderr': stderr_capture.getvalue(),
            'exitCode': exit_code
        }
        print(json.dumps(result))
        
    except Exception as e:
        error_result = {
            'stdout': '',
            'stderr': f'Failed to process request: {str(e)}',
            'exitCode': -1
        }
        print(json.dumps(error_result))

if __name__ == '__main__':
    safe_execute()

构建这个镜像： docker build -t my-python-sandbox .

3.2.2 实现沙箱管理API

接下来，我们用Python FastAPI编写一个简单的管理API，它负责创建容器、执行代码。

pip install fastapi uvicorn docker

# main.py
from fastapi import FastAPI, HTTPException
import docker
import json
import asyncio
from pydantic import BaseModel
from typing import Optional

app = FastAPI()
docker_client = docker.from_env()

class CodeExecutionRequest(BaseModel):
    code: str
    timeout: int = 30

@app.post("/execute")
async def execute_code(request: CodeExecutionRequest):
    container = None
    try:
        # 1. 创建容器，应用严格限制
        container = docker_client.containers.run(
            image='my-python-sandbox:latest',
            command=['python', 'entrypoint.py'],
            stdin_open=True, # 保持标准输入开放，用于传递代码
            detach=True,
            # 关键安全配置
            network_disabled=True, # 禁用网络
            mem_limit='256m',      # 内存限制
            pids_limit=50,         # 进程数限制
            cpu_period=100000,
            cpu_quota=50000,       # 限制最多使用50%的CPU
            read_only=True,        # 根文件系统只读
            tmpfs={'/tmp': 'rw,size=64m'}, # 仅/tmp可写，大小64MB
            user='sandbox',        # 以非root用户运行
        )
        
        # 2. 准备输入数据
        input_data = json.dumps({'code': request.code, 'timeout': request.timeout})
        
        # 3. 执行代码（带有超时控制）
        try:
            socket = container.attach_socket(params={'stdin': 1, 'stdout': 1, 'stderr': 1, 'stream': 1})
            socket._sock.sendall(input_data.encode())
            socket._sock.shutdown(1) # 关闭写入端，表示输入结束
            
            # 读取输出（简化处理，实际应流式读取）
            output = container.wait(timeout=request.timeout + 5) # 等待容器结束
            logs = container.logs(stdout=True, stderr=True).decode()
            
            # 解析输出（我们的entrypoint打印的是JSON）
            try:
                result = json.loads(logs.strip().split('\n')[-1]) # 取最后一行JSON
            except json.JSONDecodeError:
                result = {'stdout': '', 'stderr': logs, 'exitCode': output['StatusCode']}
                
        except asyncio.TimeoutError:
            container.kill() # 超时强制终止
            result = {'stdout': '', 'stderr': 'Execution timeout', 'exitCode': 124}
        finally:
            if container:
                container.remove(force=True) # 执行完毕，立即清理容器
        
        return result
        
    except docker.errors.DockerException as e:
        if container:
            container.remove(force=True)
        raise HTTPException(status_code=500, detail=f"Docker error: {str(e)}")
    except Exception as e:
        if container:
            container.remove(force=True)
        raise HTTPException(status_code=500, detail=f"Internal error: {str(e)}")

运行这个API服务： uvicorn main:app --host 0.0.0.0 --port 8000 。现在，你就可以通过向 http://你的服务器IP:8000/execute 发送POST请求（Body为 {"code": "print('hello')"} ）来安全地执行Python代码了。

踩坑实录 ：自建沙箱时，最大的挑战是安全性的粒度。上述示例中使用的 exec() 即使在受限的全局变量下也不绝对安全，Python的动态特性使得完全沙箱化非常困难。生产级方案应考虑：1）使用 seccomp 、 AppArmor 等Linux安全模块配置更严格的容器安全策略；2）考虑使用 gVisor 或 Kata Containers 等提供更强隔离的容器运行时；3）或者直接使用专门的语言沙箱库（如PyPy的沙箱功能，但已不维护）。对于高安全要求场景， 强烈建议使用成熟的云服务或经过严格审计的开源项目 ，而不是自己从头造轮子。

4. 集成AI应用：为你的智能体装上安全引擎

了解了如何创建和使用沙箱后，我们来看如何将它无缝集成到AI应用中，特别是当前火热的AI智能体（Agent）场景。

4.1 架构设计模式

将E2B沙箱集成到AI应用，通常有两种主流架构模式：

1. 同步执行模式 ：这是最简单直接的。当你的AI模型（如GPT-4、Claude）生成一段代码后，后端服务立即调用E2B API执行这段代码，等待返回结果，再将结果作为上下文反馈给AI模型，让AI根据结果决定下一步。这种模式逻辑清晰，适用于代码执行是核心且必需步骤的场景。但缺点是会增加用户等待时间（网络往返+代码执行时间）。

2. 异步任务队列模式 ：对于执行时间可能较长，或不需要即时反馈的场景，更适合异步模式。AI生成代码后，后端服务将一个“代码执行任务”推送到消息队列（如Redis、RabbitMQ）。独立的“沙箱工作进程”从队列中消费任务，调用E2B执行代码，然后将结果存储到数据库或对象存储中。前端或另一个服务可以轮询或通过WebSocket获取结果。这种模式解耦了主请求链路，提升了系统的响应速度和可扩展性。

4.2 以AI编程助手为例的集成示例

假设我们正在构建一个类似Cursor或GitHub Copilot Chat的AI编程助手，但增加了“运行代码”按钮的功能。用户可以在聊天框里让AI写一个快速排序算法，然后点击运行查看结果。

后端服务（Node.js + Express）示例 ：

// server.js
import express from 'express';
import { Sandbox } from 'e2b';
import { OpenAI } from 'openai';

const app = express();
app.use(express.json());

const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY });
const E2B_API_KEY = process.env.E2B_API_KEY;

// 端点1：AI生成代码
app.post('/api/generate-code', async (req, res) => {
  const { prompt } = req.body;
  try {
    const completion = await openai.chat.completions.create({
      model: 'gpt-4',
      messages: [
        { role: 'system', content: '你是一个Python编程专家。只返回代码，不要任何解释。如果用户请求无法用代码实现，返回“# 无法生成代码”。' },
        { role: 'user', content: prompt }
      ],
      temperature: 0.2,
    });
    const generatedCode = completion.choices[0].message.content;
    res.json({ code: generatedCode });
  } catch (error) {
    res.status(500).json({ error: 'AI生成失败' });
  }
});

// 端点2：安全执行代码
app.post('/api/execute-code', async (req, res) => {
  const { code, language = 'python' } = req.body; // 可扩展支持多语言
  if (!code || code.trim() === '') {
    return res.status(400).json({ error: '代码为空' });
  }

  let sandbox;
  try {
    // 根据语言选择不同的E2B模板
    const template = language === 'python' ? 'python3' : 'nodejs16'; // 示例
    sandbox = await Sandbox.create({ template, apiKey: E2B_API_KEY });

    // 设置执行超时
    const timeoutMs = 30000;
    const execution = await sandbox.runCode({
      code: code,
      timeout: timeoutMs,
    });

    res.json({
      stdout: execution.stdout,
      stderr: execution.stderr,
      exitCode: execution.exitCode,
      executionTime: execution.executionTime, // E2B SDK可能返回这个字段
    });
  } catch (error) {
    console.error('沙箱执行错误:', error);
    res.status(500).json({ error: `执行失败: ${error.message}` });
  } finally {
    if (sandbox) {
      await sandbox.close().catch(e => console.error('关闭沙箱失败:', e));
    }
  }
});

app.listen(3000, () => console.log('Server running on port 3000'));

前端简易调用示例（React） ：

// CodeRunnerComponent.jsx
import React, { useState } from 'react';
import axios from 'axios';

function CodeRunnerComponent() {
  const [prompt, setPrompt] = useState('写一个Python函数计算斐波那契数列第n项');
  const [generatedCode, setGeneratedCode] = useState('');
  const [output, setOutput] = useState({ stdout: '', stderr: '', isLoading: false });

  const handleGenerate = async () => {
    const resp = await axios.post('/api/generate-code', { prompt });
    setGeneratedCode(resp.data.code);
  };

  const handleExecute = async () => {
    setOutput({ ...output, isLoading: true });
    try {
      const resp = await axios.post('/api/execute-code', { code: generatedCode });
      setOutput({ stdout: resp.data.stdout, stderr: resp.data.stderr, isLoading: false });
    } catch (error) {
      setOutput({ stdout: '', stderr: `请求错误: ${error.message}`, isLoading: false });
    }
  };

  return (
    <div>
      <textarea value={prompt} onChange={(e) => setPrompt(e.target.value)} />
      <button onClick={handleGenerate}>生成代码</button>
      <pre>{generatedCode}</pre>
      <button onClick={handleExecute} disabled={!generatedCode || output.isLoading}>
        {output.isLoading ? '运行中...' : '运行代码'}
      </button>
      <div>
        <h4>输出：</h4>
        <pre style={{color: 'green'}}>{output.stdout}</pre>
        <pre style={{color: 'red'}}>{output.stderr}</pre>
      </div>
    </div>
  );
}

在这个流程中，AI负责生成代码，而E2B沙箱负责在一个安全、隔离的环境中验证这段代码的实际运行效果，形成了一个安全的“思考-行动”闭环。

4.3 安全策略与成本优化

集成后，还有两个现实问题需要处理：安全和成本。

安全增强策略 ：

输入净化与校验 ：在将AI生成的代码发送到沙箱前，进行简单的静态分析。使用正则表达式或AST（抽象语法树）解析器检查是否包含明显危险的模式，如尝试导入 os 、 subprocess 、 socket ，或包含 eval() 、 exec() 、 __import__ 等函数调用。可以建立一个模块黑白名单。
资源限制精细化 ：根据代码的预期任务调整沙箱参数。一个数据处理脚本可能需要更多CPU和内存，而一个简单的字符串操作则只需要很少资源。可以在用户请求或AI判断中附带资源需求标签。
审计与日志 ：记录所有执行的代码、执行结果、资源使用情况和用户标识。这对于事后分析、调试和应对潜在滥用至关重要。

成本控制技巧 ：

沙箱复用与连接池 ：对于频繁的、短小的代码执行请求（如用户交互式地执行单行命令），不要为每个请求都创建和销毁沙箱。可以维护一个“沙箱连接池”，将空闲的沙箱实例保留几分钟以备复用。E2B的SDK通常支持保持沙箱活跃状态。
预热的模板 ：如果知道主要运行Python，可以提前创建并“预热”几个Python沙箱实例，减少冷启动时间。
设置预算与告警 ：在E2B控制台或自己的计费系统中设置月度预算和告警，防止因意外流量或代码死循环导致巨额费用。
异步与批处理 ：对于非实时性的代码检查或测试任务，可以采用异步队列，在服务器负载低峰期批量执行。

5. 常见问题排查与进阶技巧

在实际使用中，你肯定会遇到各种各样的问题。这里我整理了一份从入门到进阶的“避坑指南”。

5.1 基础问题速查表

问题现象	可能原因	排查步骤与解决方案
沙箱启动超时	1. 网络问题导致无法拉取镜像。 2. E2B服务端负载高。 3. 账户额度用尽。	1. 检查网络连接和防火墙。 2. 查看E2B服务状态页。 3. 登录控制台检查额度使用情况。
代码执行无输出	1. 代码本身没有打印语句。 2. 代码陷入死循环或阻塞，被超时终止。 3. 代码语法错误导致提前退出。	1. 在代码开头和结尾添加打印语句调试。 2. 检查 `stderr` 是否有超时或错误信息。 3. 先在本地或简单环境中测试代码逻辑。
`ModuleNotFoundError`	沙箱基础镜像中未安装该Python包。	1. 在代码中使用 `subprocess` 调用 `pip install` （需网络）。 2. 使用E2B支持的、预装了更多包的定制模板。 3. 自建镜像时，将依赖打包进Dockerfile。
权限错误（如写文件失败）	沙箱容器文件系统只读，或对特定路径无写权限。	1. 确保文件操作在 `/tmp` 目录下进行。 2. 检查自建沙箱的 `tmpfs` 挂载配置。 3. 确认运行代码的用户是否有足够权限。
网络请求失败	沙箱默认禁用网络，或网络策略限制。	1. 确认创建沙箱时是否启用了网络（ `{ apiKey, template, enableNetworking: true }` ）。 2. 检查请求的目标地址是否在防火墙白名单内（企业版功能）。
内存不足（OOM）	代码申请内存超过沙箱限制。	1. 优化代码，减少内存使用（如流式处理大文件）。 2. 创建沙箱时增加内存限制（ `memoryMB` 参数）。 3. 在代码中添加资源监控逻辑。

5.2 性能优化与高级用法

当你的应用度过原型阶段，开始面临真实用户流量时，这些进阶技巧会很有帮助。

1. 流式输出处理 ：对于执行时间较长的代码，让用户实时看到输出至关重要。E2B SDK支持流式输出。以下是在Node.js中处理流式输出的示例：

const sandbox = await Sandbox.create({ template: 'python3', apiKey });
const code = `import time
for i in range(5):
    print(f"Progress: {i+1}/5")
    time.sleep(1)
`;

// 使用 runCode 的 streaming 模式
const executionStream = await sandbox.runCodeStreaming({
  code: code,
  timeout: 10000,
});

// 监听实时输出
for await (const message of executionStream) {
  if (message.type === 'stdout') {
    console.log('实时输出:', message.line); // 逐行输出
    // 可以在这里将输出通过WebSocket推送给前端
  } else if (message.type === 'stderr') {
    console.error('实时错误:', message.line);
  } else if (message.type === 'done') {
    console.log('执行完成，退出码:', message.exitCode);
    break;
  }
}

2. 多语言支持与定制模板 ： E2B不仅支持Python，还支持Node.js、Java、Go、Rust等多种语言的预置模板。你甚至可以根据需要创建自己的定制模板。例如，如果你的AI需要频繁运行数据科学代码，可以创建一个预装了 pandas , numpy , matplotlib 的定制模板，这样每次执行就无需重复安装，大幅缩短启动时间。

3. 文件系统快照与持久化 ：有时，多次代码执行之间需要共享文件（例如，第一次执行生成了一个数据文件，第二次执行要读取它）。虽然沙箱本身是无状态的，但你可以利用E2B的文件系统操作API，在执行完毕后将需要的文件下载到你的服务器存储（如S3），然后在下次创建沙箱后上传回去。更高级的用法是使用E2B的“文件系统快照”功能（如果提供），可以保存某个沙箱的文件系统状态，并基于此快照创建新的沙箱。

4. 与CI/CD管道集成 ： E2B沙箱可以成为自动化测试流程的一部分。例如，在GitHub Actions中，你可以设置一个工作流，每当有Pull Request时，自动用E2B沙箱运行测试套件，确保新代码不会引入破坏性变更或安全风险，而无需占用你宝贵的构建机资源。

# .github/workflows/test-with-sandbox.yml
name: Test in Secure Sandbox
on: [pull_request]
jobs:
  e2b-test:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v3
      - name: Run tests in E2B
        env:
          E2B_API_KEY: ${{ secrets.E2B_API_KEY }}
        run: |
          # 使用E2B CLI或编写脚本，将测试代码发送到沙箱执行
          npx e2b run --template python3 --code "$(cat run_tests.py)" --api-key $E2B_API_KEY

5. 监控与可观测性 ：在生产环境中，你需要监控沙箱的使用情况。关键指标包括：沙箱创建成功率、平均执行时间、资源使用率（CPU/内存）、错误类型分布（超时、OOM、语法错误等）。这些指标可以帮助你优化资源配额、调整超时设置，并快速发现异常模式（如突然出现大量死循环代码，可能意味着受到了攻击或AI模型行为异常）。

最后，我想分享一点个人体会。技术选型上，对于绝大多数团队， 直接使用成熟的E2B云服务是性价比最高的选择 。它让你能专注于业务逻辑，而非基础设施安全。自建方案虽然可控性强，但其在安全性、稳定性和功能完整性上要达到同等水平，所需投入的运维和开发成本远超想象。安全无小事，尤其是在执行不可信代码这件事上，选择一个经过市场检验的专业服务，往往是更负责任的做法。