Deepchecks
不活跃简介
面向 ML 与 LLM 应用的测试与监控平台,类比 'unit tests for AI'。
核心特性
- ML 测试 — 训练前后自动检查数据漂移、标签泄漏、模型性能
- LLM 评估 — 内置幻觉、偏见、毒性的评估检查
- CI 友好 — 几行代码接入 pytest
- 可视化 — HTML 报告直观呈现检查结果
- 开源自托管 — 数据留在本地,敏感行业可用
- 可扩展 — 自定义 Check 与 Suite 满足业务需求
适用场景
💡 为 ML 团队建立模型上线前的回归测试。
💡 对 LLM 回答做幻觉与毒性自动检查。
💡 在 CI 中跑数据漂移检查,防止模型退化。
分类
快速开始
# 安装
pip install deepchecks
# LLM 评估示例
from deepchecks.llm.checks import Toxicity
result = Toxicity().run(
production_samples={'text': ['我讨厌这个产品']},
)
result.show()