PyRIT

活跃

GitHub Python MIT

简介

微软开源的生成式AI风险评估框架，帮助安全专业人员主动识别生成式AI系统中的安全风险，支持红队测试和自动化攻击探测。

核心特性

自动化红队测试框架：专为生成式 AI 系统设计的自动化攻击探测工具，帮助安全专业人员系统性地识别 LLM 应用中的安全风险
多阶段攻击策略：支持从简单提示注入到复杂多轮对话的渐进式攻击路径，模拟真实威胁场景下的对抗行为
风险量化与评分：内置 Attack Success Rate（ASR）等指标量化评估系统安全风险，支持对比不同防护策略的有效性
可扩展攻击模块：模块化架构支持自定义攻击场景和探针，可针对特定业务场景定制红队测试用例
微软官方维护与生态集成：作为微软 AI 安全生态的一部分，与 Azure AI Foundry、AI Red Teaming Agent 等工具链深度集成

适用场景

💡 LLM 应用上线前安全评估：在生成式 AI 应用发布前，自动化探测提示注入、越狱、数据泄露等安全漏洞，量化风险等级

💡 持续安全监控：在 AI 系统运行期间定期执行红队测试，检测因模型更新或新攻击手法引入的安全退化

💡 安全合规验证：为受监管行业（金融、医疗、政务）的 AI 系统提供可审计的安全测试证据，满足合规审查要求

💡 AI 安全研究与基准测试：支持学术界和工业界对生成式 AI 安全性的系统研究，建立安全基准和攻击分类体系

💡 防护策略有效性验证：对比不同安全防护措施（系统提示加固、输出过滤、内容审核）在对抗攻击下的实际防护效果

分类

🛡️ 安全护栏

快速开始

安装：pip install pyrit；初始化 Orchestrator：from pyrit.orchestrator import PromptSendingOrchestrator; orchestrator = PromptSendingOrchestrator()；配置目标和攻击探针；运行红队测试并分析 ASR 等风险指标

访问 GitHub

PyRIT

简介

核心特性

适用场景

标签

分类

快速开始

相关项目

Purple Llama

LLM Guard

Giskard

PentestGPT

相关文章

AI Agent 安全攻防实战：从 Prompt 注入到纵深防御