相关项目
Rebuff
1.5k · TypeScript
针对 LLM 的提示词注入检测器,结合启发式规则、向量相似度和语言模型多重防御策略,有效识别和阻止恶意提示注入攻击。
securityllmtesting +2
Purple Llama
4.2k · Python
Meta 推出的 LLM 安全评估工具集,提供安全基准测试、提示注入检测和输出审核等功能,帮助评估和提升大型语言模型的安全性。
securityevaluationpython +2
Agentic Radar
974 · Python
Agentic Radar 是一个面向 LLM Agent 工作流的安全扫描器。可自动检测智能体管道中的安全漏洞、提示注入风险和权限越界问题,帮助团队在部署前发现和修复 AI Agent 的安全隐患。
securityagentpython +2
PyRIT
3.9k · Python
微软开源的生成式AI风险评估框架,帮助安全专业人员主动识别生成式AI系统中的安全风险,支持红队测试和自动化攻击探测。
pythonsecurityevaluation +2