Promptfoo

活跃

GitHub TypeScript MIT

简介

Promptfoo 是面向 LLM 应用与 Agent 的评测与回归测试工具，可批量比较提示词、工具调用结果与模型输出，适合为 Agent 工作流建立持续评测基线。

💡 在生产环境部署前评估 LLM 提示词质量

💡 对 AI 应用进行红队安全测试发现潜在漏洞

💡 在多个 LLM 提供商之间选择最适合的模型

💡 建立 LLM 应用的持续回归测试基线

npm install -g promptfoo
export OPENAI_API_KEY=sk-xxx
promptfoo init --example getting-started
cd getting-started
promptfoo eval
promptfoo view