AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
首页 / 项目 / Argilla

Argilla

活跃
GitHub Python Apache-2.0

简介

Argilla 是面向 AI 工程师和领域专家的协作平台,支持构建高质量数据集、人工反馈收集与模型评估。

标签

evaluation data-processing llm python framework

分类

📊 可观测性
访问 GitHub 访问官网

项目指标

Stars 4.9k
Forks 479
Watchers 4.9k
Issues 26
创建时间 2021年4月28日
最近提交 2026年4月13日

部署方式

Docker

相关项目

Hugging Face Evaluate

2.4k · Python
活跃

Hugging Face 官方模型与数据集评估库,提供丰富的评估指标和方法,轻松评估机器学习模型性能和数据集质量。

evaluationllmpython +2

Weave

1.1k · Python
活跃

Weights & Biases 推出的 AI 应用开发工具包,提供 LLM 调用追踪、评估实验管理和版本化能力,助力 AI 应用从原型到生产的全流程管理。

observabilityevaluationllm +2

PrompToMatix

948 · Python
不活跃

Salesforce AI Research 推出的自动提示词优化框架,利用 LLM 自动搜索和优化提示词以提升模型性能。

prompt-engineeringevaluationllm +1

AgentBench

3.3k · Python
正常

A comprehensive benchmark to evaluate LLMs as agents (ICLR 2024), covering operating systems, databases, knowledge graphs, digital card games and more.

evaluationpythonagent +1
AgentList

开源机器人/Agent 项目导航站

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community