相关项目
Agent Governance Toolkit
3.8k · Python
微软推出的 AI 智能体治理工具包,提供策略执行、零信任身份验证、执行沙箱和可靠性工程,覆盖 OWASP 智能体 Top 10 全部安全风险。
securityevaluationpython +2
Rogue
1.0k · Python
AI 智能体评估与红队测试平台,提供系统化的安全评估和对抗性测试工具,帮助发现和修复智能体系统的安全漏洞。
securityevaluationobservability +2
Giskard
5.4k · Python
开源 LLM Agent 评估与测试库,提供自动化模型扫描、偏见检测、性能基准测试和合规检查,帮助团队在部署前全面验证 AI Agent 质量。
evaluationtestingllm-safety +3
Purple Llama
4.2k · Python
Meta 推出的 LLM 安全评估工具集,提供安全基准测试、提示注入检测和输出审核等功能,帮助评估和提升大型语言模型的安全性。
securityevaluationpython +2