AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
首页 / 项目 / Giskard

Giskard

活跃
GitHub Python Apache-2.0

简介

开源 LLM Agent 评估与测试库,提供自动化模型扫描、偏见检测、性能基准测试和合规检查,帮助团队在部署前全面验证 AI Agent 质量。

标签

evaluation testing llm-safety bias-detection compliance python

分类

📊 可观测性
访问 GitHub 访问官网 查看文档

项目指标

Stars 5.3k
Forks 436
Watchers 5.3k
Issues 45
创建时间 2022年3月6日
最近提交 2026年4月17日

部署方式

本地部署

相关项目

AgentLabs

546 · TypeScript
不活跃

AgentLabs 是一个面向 Agent 开发与测试的工具集合,强调实验、回放和开发流程辅助,适合帮助团队提升 Agent 迭代效率。

testingdeveloper-toolsevaluation +1

Agentic Radar

953 · Python
不活跃

A security scanner for LLM agentic workflows. Automatically detects security vulnerabilities, prompt injection risks, and permission violations in agent pipelines before deployment.

securityagentpython +2

PrompToMatix

948 · Python
不活跃

Salesforce AI Research 推出的自动提示词优化框架,利用 LLM 自动搜索和优化提示词以提升模型性能。

prompt-engineeringevaluationllm +1

AgentBench

3.3k · Python
正常

A comprehensive benchmark to evaluate LLMs as agents (ICLR 2024), covering operating systems, databases, knowledge graphs, digital card games and more.

evaluationpythonagent +1
AgentList

开源机器人/Agent 项目导航站

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community