Deepchecks

不活跃
GitHub Python NOASSERTION

简介

面向 ML 与 LLM 应用的测试与监控平台,类比 'unit tests for AI'。

核心特性

  • ML 测试 — 训练前后自动检查数据漂移、标签泄漏、模型性能
  • LLM 评估 — 内置幻觉、偏见、毒性的评估检查
  • CI 友好 — 几行代码接入 pytest
  • 可视化 — HTML 报告直观呈现检查结果
  • 开源自托管 — 数据留在本地,敏感行业可用
  • 可扩展 — 自定义 Check 与 Suite 满足业务需求

适用场景

💡 为 ML 团队建立模型上线前的回归测试。
💡 对 LLM 回答做幻觉与毒性自动检查。
💡 在 CI 中跑数据漂移检查,防止模型退化。

快速开始

# 安装
pip install deepchecks
# LLM 评估示例
from deepchecks.llm.checks import Toxicity
result = Toxicity().run(
    production_samples={'text': ['我讨厌这个产品']},
)
result.show()

相关项目