JailTrickBench

相关项目

Jailbreak LLMs

3.7k · Jupyter Notebook

不活跃

一个包含 15,140 条 ChatGPT 提示词的数据集（含 1,405 条越狱提示词），来自 Reddit、Discord 等多平台，为 LLM 安全研究和越狱检测提供了大规模基准数据。

jailbreakllm-safetybenchmark +2

Giskard

5.3k · Python

活跃

开源 LLM Agent 评估与测试库，提供自动化模型扫描、偏见检测、性能基准测试和合规检查，帮助团队在部署前全面验证 AI Agent 质量。

evaluationtestingllm-safety +3

AgentShield Benchmark

21 · TypeScript

活跃

AI 智能体安全工具的开放基准测试，涵盖提示注入、数据泄露、工具滥用和来源追踪等安全维度的评估。

securitybenchmarkai-safety +2

EasyJailbreak

851 · Python

正常

一个易于使用的 Python 框架，用于生成对抗性越狱提示词，帮助研究人员系统性评估 LLM 的安全防护能力，支持多种攻击方法组合。