AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
首页 / 项目 / Bananalyzer

Bananalyzer

正常
GitHub Python MIT

简介

开源 AI Agent 网页任务评估框架,用于衡量和比较 AI Agent 在网页操作任务上的表现。

标签

agent-evaluation web-tasks benchmark observability python

分类

📊 可观测性 🌐 浏览器 Agent
访问 GitHub

项目指标

Stars 327
Forks 0
Watchers 0
Issues 0
创建时间 2025年1月1日
最近提交 2026年2月28日

部署方式

本地部署

相关项目

LM Evaluation Harness

12.3k · Python
活跃

EleutherAI 推出的大语言模型评估框架,提供标准化的少样本评测流水线,支持数百项基准任务,是 LLM 社区广泛采用的核心评测工具。

llm-evaluationbenchmarkevaluation-framework +2

HolmesGPT

2.2k · Python
活跃

CNCF 沙箱项目,面向 SRE 场景的 AI Agent,自动分析基础设施日志和指标,辅助故障诊断和系统运维。

observabilitypythonagent +2

SwanLab

3.8k · Python
活跃

开源的现代设计 AI 训练追踪与可视化工具,支持 PyTorch、Transformers 等主流框架,帮助开发者监控和评估 AI Agent 的训练过程。

pythonobservabilityevaluation +2

AgentDiff

27 · Python
活跃

AI Agent 评估和强化学习的交互式沙箱环境,支持 Slack、LinkedIn 等第三方 API 测试。

agent-evaluationsandboxreinforcement-learning +2
AgentList

开源机器人/Agent 项目导航站

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community