AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
首页 / 项目 / Harbor

Harbor

活跃
GitHub Python Apache-2.0

简介

Agent 评估框架,支持运行 Agent 基准测试和创建强化学习环境,用于衡量和改进 Agent 性能

标签

evaluation benchmark rl-environments agent-testing python

分类

📊 可观测性 ⚡ Agent 工具
访问 GitHub 访问官网

项目指标

Stars 1.5k
Forks 918
Watchers 1.5k
Issues 264
创建时间 2025年8月4日
最近提交 2026年4月17日

部署方式

本地部署

相关项目

AgentLabs

546 · TypeScript
不活跃

AgentLabs 是一个面向 Agent 开发与测试的工具集合,强调实验、回放和开发流程辅助,适合帮助团队提升 Agent 迭代效率。

testingdeveloper-toolsevaluation +1

Prompt Ops

800 · Python
活跃

An open-source tool from Meta for LLM prompt optimization. Automates the process of continuously improving and refining LLM prompts.

prompt-engineeringllmtools +2

DeepEval

14.8k · Python
活跃

DeepEval 是一个用于 LLM 应用的开源评估框架。提供丰富的评估指标和工具,支持单元测试、集成测试,帮助开发者构建可靠的 LLM 应用。

llmevaluationtesting +1

RouteLLM

4.8k · Python
不活跃

RouteLLM 是一个用于 LLM 路由服务的评估框架,通过智能请求路由在降低推理成本的同时保持输出质量,支持多种路由策略的对比评测。

llm-routingcost-optimizationevaluation +1
AgentList

开源机器人/Agent 项目导航站

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community