AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
首页 / 项目 / WebArena

WebArena

不活跃
GitHub Python Apache-2.0

简介

WebArena 是一个用于评估自主 Web Agent 的真实基准环境,提供类 Gym 接口的交互式网站模拟,涵盖电商、论坛、CMS 等场景,支持端到端任务评估,是 Web Agent 研究领域的标准评测框架。

标签

benchmark web-agent evaluation e2e-testing research python

分类

🌐 浏览器 Agent
访问 GitHub

项目指标

Stars 1.4k
Forks 232
Watchers 1.4k
Issues 93
创建时间 2023年7月24日
最近提交 2025年11月26日

部署方式

本地部署

相关项目

LaVague

6.3k · Python
不活跃

LaVague 是大型动作模型(LAM)框架,用于开发 AI 网页 Agent,结合 RAG 技术实现自然语言驱动的浏览器自动化操作。

browserweb-agentlarge-action-model +2

Notte

1.9k · Python
活跃

Notte 是构建网页 Agent 和部署无服务器浏览器自动化函数的框架,提供可靠的浏览器基础设施和感知网页的 Agent 能力。

browserweb-agentautomation +1

Hercules

980 · Python
活跃

首个开源测试 Agent,支持 UI、API、安全、可访问性和视觉验证,无需编写代码即可实现全面自动化测试

testing-agentbrowser-testinge2e-testing +3

MTEB

3.2k · Python
活跃

MTEB(Massive Text Embedding Benchmark)是一个大规模文本嵌入基准测试框架,覆盖分类、检索、聚类、重排序等多项任务,用于评估和选择 RAG 系统中的最佳嵌入模型。

embeddingbenchmarkevaluation +3
AgentList

开源机器人/Agent 项目导航站

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community