AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 JailTrickBench

JailTrickBench

不活跃
GitHub Python MIT

简介

NeurIPS 2024 论文配套的 LLM 越狱攻击基准测试工具,系统收集和评估越狱攻击技巧,为 LLM 安全研究提供标准化评测框架。

标签

benchmark jailbreak llm-safety neurips evaluation

分类

🛡️ 安全护栏
访问 GitHub 访问官网

项目指标

Stars 162
Forks 13
Watchers 162
Issues 4
创建时间 2024年6月13日
最近提交 2024年11月30日

部署方式

本地部署

相关项目

Jailbreak LLMs

3.7k · Jupyter Notebook
不活跃

一个包含 15,140 条 ChatGPT 提示词的数据集(含 1,405 条越狱提示词),来自 Reddit、Discord 等多平台,为 LLM 安全研究和越狱检测提供了大规模基准数据。

jailbreakllm-safetybenchmark +2

Giskard

5.3k · Python
活跃

开源 LLM Agent 评估与测试库,提供自动化模型扫描、偏见检测、性能基准测试和合规检查,帮助团队在部署前全面验证 AI Agent 质量。

evaluationtestingllm-safety +3

AgentShield Benchmark

21 · TypeScript
活跃

AI 智能体安全工具的开放基准测试,涵盖提示注入、数据泄露、工具滥用和来源追踪等安全维度的评估。

securitybenchmarkai-safety +2

EasyJailbreak

851 · Python
正常

一个易于使用的 Python 框架,用于生成对抗性越狱提示词,帮助研究人员系统性评估 LLM 的安全防护能力,支持多种攻击方法组合。

jailbreakadversarialllm-safety +2
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community