AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 Multi-SWE-bench

Multi-SWE-bench

不活跃
GitHub Python Apache-2.0

简介

多语言软件工程 Agent 基准测试集,扩展 SWE-bench 至多语言场景,用于评估 AI Agent 跨编程语言的 Issue 解决能力。

标签

benchmark swe-bench multilingual evaluation software-engineering python

分类

💻 编码 Agent
访问 GitHub

项目指标

Stars 336
Forks 54
Watchers 336
Issues 16
创建时间 2025年2月18日
最近提交 2025年12月18日

部署方式

本地部署

相关项目

SWE-smith

664 · Python
活跃

SWE Agent 训练数据规模化生成工具包(NeurIPS 2025 D&B Spotlight),用于自动创建大规模软件工程 Agent 训练数据集,推动 SWE Agent 能力提升。

swe-agenttraining-databenchmark +3

SWE-bench

5.1k · Python
正常

SWE-bench 是一个评估大语言模型解决真实 GitHub Issue 能力的基准测试框架,包含来自多个流行 Python 仓库的真实问题,已成为衡量 AI 编程智能体能力的核心标准。

evaluationpythoncoding +2

Augment SWE-bench Agent

873 · Python
不活跃

Augment SWE-bench Agent 是 SWE-bench Verified 排行榜上排名第一的开源实现,展示了如何构建高性能的软件工程智能体来自动解决 GitHub Issue。

codingpythonagent +2

Trae Agent

11.6k · Python
不活跃

字节跳动开源的通用软件工程 LLM Agent,面向编码、调试与仓库级开发任务自动化。

coding-agentsoftware-engineeringllm +1
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community