SCAM

相关项目

pytest-evals

159 · Jupyter Notebook

不活跃

基于 pytest 的 LLM 评估测试插件，支持运行和分析大语言模型的评估测试，帮助开发者系统化地验证 AI 智能体的表现。

evaluationtestingllm +2

Giskard

5.3k · Python

活跃

开源 LLM Agent 评估与测试库，提供自动化模型扫描、偏见检测、性能基准测试和合规检查，帮助团队在部署前全面验证 AI Agent 质量。

evaluationtestingllm-safety +3

Spikee

183 · Python

活跃

简单高效的提示注入测试工具包，用于评估和利用 LLM 应用中的提示注入漏洞，帮助安全团队快速验证防御效果。

prompt-injectionsecurity-testingexploitation +2

SecureClaw

337 · TypeScript

活跃

对齐 OWASP 标准的 AI Agent 安全插件，为 Agent 系统提供全面的安全评估和防护能力，涵盖提示注入防护、权限控制等关键安全领域。