AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 Windows Agent Arena

Windows Agent Arena

正常
GitHub Python MIT

简介

「Windows Agent Arena」是平台型仓库:面向 Agent 与 LLM 的可观测、追踪与评估能力。

标签

benchmark computer-use windows python

分类

📊 可观测性 🌐 浏览器 Agent
访问 GitHub

项目指标

Stars 863
Forks 94
Watchers 863
Issues 35
创建时间 2024年7月29日
最近提交 2026年4月13日

部署方式

本地部署

相关项目

Bananalyzer

328 · Python
不活跃

开源 AI Agent 网页任务评估框架,用于衡量和比较 AI Agent 在网页操作任务上的表现。

agent-evaluationweb-tasksbenchmark +2

WebQA Agent

215 · Python
活跃

自主网页浏览测试 Agent,可对网站性能、功能和用户体验进行自动化评估,支持 GUI 与 CLI 使用。

browser-agentweb-testingqa +2

LM Evaluation Harness

12.8k · Python
活跃

EleutherAI 推出的大语言模型评估框架,提供标准化的少样本评测流水线,支持数百项基准任务,是 LLM 社区广泛采用的核心评测工具。

llm-evaluationbenchmarkevaluation-framework +2

Windows MCP

5.8k · Python
活跃

Windows MCP 是一个面向 Windows 桌面的 MCP 服务器,为 AI 代理提供计算机使用能力,支持桌面自动化和系统操作。

mcpwindowsdesktop-automation +2
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community