最佳沙箱执行 Top 20
精选 20 个最受欢迎的开源沙箱执行项目,按 GitHub Stars 排名。
Daytona
72.4k StarsDaytona 提供面向开发 Agent 与自动化任务的安全开发环境基础设施,适合作为代码 Agent、远程执行与开发者工作流自动化的运行底座。
DeerFlow
67.0k Stars字节跳动开源的长周期 SuperAgent 框架,支持研究、编码和创作任务,具备沙箱环境、记忆系统、工具调用和子 Agent 协同能力,可处理从分钟到小时级别的复杂任务。
CUA
16.0k StarsCUA 是开源的计算机使用 Agent 基础设施,提供沙箱、SDK 和基准测试,支持 AI Agent 控制完整桌面环境。
Context Mode
14.4k StarsContext Mode 是面向 AI 编程 Agent 的上下文窗口优化工具,通过沙盒化工具输出实现 98% 的上下文缩减,支持 12 个主流编程平台。
E2B
12.2k StarsE2B 提供面向 AI Agent 的安全云沙箱运行环境,支持代码执行、文件操作与隔离计算,适合作为代码 Agent、数据 Agent 与自动化任务的执行层。
OpenSandbox
10.6k StarsOpenSandbox 是阿里巴巴开源的安全、快速、可扩展的 AI Agent 沙箱运行时环境。
Databend
9.3k StarsDatabend 是一个面向 AI Agent 的现代数据仓库,统一了分析、搜索和 AI 能力。支持 Python 沙箱、向量搜索和全文搜索,可直接在 S3 上运行,为 AI 智能体提供即时的数据查询与分析能力。
Steel Browser
7.0k StarsSteel Browser 是一个专为 AI Agent 和应用设计的开源浏览器沙盒,提供完整的浏览器 API,支持会话管理、代理集成和自动反检测,让开发者无需关注基础设施即可实现 Web 自动化。
Microsandbox
6.0k Stars为 AI Agent 提供安全、本地化、跨平台和可编程的沙箱环境。基于微虚拟机技术实现严格的资源隔离,确保 Agent 执行代码时的安全性和可控性。
CubeSandbox
5.4k Stars腾讯云开源的高性能 AI Agent 代码沙箱,基于 RustVMM 和 KVM 实现硬件级隔离,冷启动低于 60ms,单实例内存开销低于 5MB,兼容 E2B SDK 接口。
Magicrew
4.8k Stars开源一站式 AI 生产力平台,集通用 AI Agent、工作流引擎、即时通讯和在线文档于一体
Agent Sandbox
4.6k Stars一体化 AI 智能体沙箱运行环境,将浏览器、Shell、文件系统、MCP 和 VSCode Server 集成在单个 Docker 容器中,为智能体提供安全隔离的执行环境。
WebContainer
4.6k Stars在浏览器中运行Node.js运行时环境的开源引擎,支持在Web应用中实现完全沙箱化的开发环境,无需服务器端执行。
Judge0
4.2k StarsJudge0 是成熟的开源代码执行与在线评测系统,支持多语言编译运行、资源限制和 API 调用。虽然最初面向判题场景,它也常被用于 LLM 代码生成验证和 Agent 执行工具链,为模型输出提供可控运行环境。
Sandcastle
4.1k Stars用于编排沙箱化编码 Agent 的 TypeScript 工具,基于 sandcastle.run 提供安全执行环境。
Sandbox Runtime
4.0k StarsSandbox Runtime 是 Anthropic 实验项目,提供用于 Agent 任务的轻量级隔离运行时。项目重点解决模型执行代码时的安全边界、文件访问和命令控制问题,可作为构建代码解释器、自动修复和研究型代理的基础组件。
Arrow
3.5k StarsArrow 是面向 Agentic 时代的前端 UI 框架,体积小巧、性能优异,内置 WASM 沙箱实现安全代码执行,专为构建 AI Agent 交互界面而设计。
Amazon Bedrock Agentcore Samples
2.8k StarsAmazon Bedrock Agentcore 示例项目集,帮助开发者将 AI 智能体安全地部署到生产环境,提供企业级可靠性保障。
Moltis
2.7k StarsRust 编写的安全持久化个人 Agent 服务器,单二进制文件,支持沙盒执行、多 LLM 提供商、语音、记忆和 MCP 工具。
Codel
2.4k Stars全自主 AI 智能体,可通过终端、浏览器和编辑器执行复杂任务和项目,支持安全沙盒执行环境。
相关文章
Agent 评估与测试体系:从单轮评分到端到端流水线
大多数团队靠"看起来对了"来判断 Agent 质量。真正的评估需要三层指标、不腐烂的数据集、以及不会什么都同意的评判器。本文给出可运行的代码和可落地的决策框架。
AI Agent 沙箱与代码执行安全:隔离策略与实战方案
对比容器、WebAssembly、进程级隔离三种沙箱方案,结合实战代码讲解如何安全执行 Agent 生成的代码。
Browser Agent 实战:让 AI 操控浏览器的架构与陷阱
从裸 Playwright 到结构化提取,拆解三层浏览器自动化抽象的适用场景、生产模式和常见踩坑。