AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 Promptfoo

Promptfoo

活跃
GitHub TypeScript MIT

简介

Promptfoo 是面向 LLM 应用与 Agent 的评测与回归测试工具,可批量比较提示词、工具调用结果与模型输出,适合为 Agent 工作流建立持续评测基线。

标签

evaluation testing prompts typescript

分类

📊 可观测性
访问 GitHub 访问官网 查看文档

项目指标

Stars 21.9k
Forks 1.9k
Watchers 21.9k
Issues 310
创建时间 2023年4月28日
最近提交 2026年6月4日

部署方式

本地部署

相关项目

Agenta

4.2k · TypeScript
活跃

Agenta 是一个开源 LLMOps 平台,提供 Prompt Playground、Prompt 管理、LLM 评估和可观测性的一站式解决方案。

observabilityllmopsprompt-management +2

Deep Research Bench

742 · Python
活跃

深度研究 Agent 综合基准测试,提供系统化的深度研究能力评估框架,用于评测各类深度研究 Agent 的表现。

benchmarkevaluationdeep-research +2

Giskard

5.4k · Python
活跃

开源 LLM Agent 评估与测试库,提供自动化模型扫描、偏见检测、性能基准测试和合规检查,帮助团队在部署前全面验证 AI Agent 质量。

evaluationtestingllm-safety +3

AgentLabs

550 · TypeScript
不活跃

AgentLabs 是一个面向 Agent 开发与测试的工具集合,强调实验、回放和开发流程辅助,适合帮助团队提升 Agent 迭代效率。

testingdeveloper-toolsevaluation +1
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community