SCAM
正常简介
1Password 开源的安全意识基准测试工具,通过真实的多轮工作任务测试 AI Agent 的安全意识水平,帮助评估 Agent 在职场场景中的安全风险。
1Password 开源的安全意识基准测试工具,通过真实的多轮工作任务测试 AI Agent 的安全意识水平,帮助评估 Agent 在职场场景中的安全风险。
基于 pytest 的 LLM 评估测试插件,支持运行和分析大语言模型的评估测试,帮助开发者系统化地验证 AI 智能体的表现。
开源 LLM Agent 评估与测试库,提供自动化模型扫描、偏见检测、性能基准测试和合规检查,帮助团队在部署前全面验证 AI Agent 质量。
简单高效的提示注入测试工具包,用于评估和利用 LLM 应用中的提示注入漏洞,帮助安全团队快速验证防御效果。
对齐 OWASP 标准的 AI Agent 安全插件,为 Agent 系统提供全面的安全评估和防护能力,涵盖提示注入防护、权限控制等关键安全领域。