AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 Hugging Face Evaluate

Hugging Face Evaluate

活跃
GitHub Python Apache-2.0

简介

Hugging Face 官方模型与数据集评估库,提供丰富的评估指标和方法,轻松评估机器学习模型性能和数据集质量。

标签

evaluation llm python huggingface framework

分类

📊 可观测性
访问 GitHub 访问官网

项目指标

Stars 2.5k
Forks 320
Watchers 2.5k
Issues 279
创建时间 2022年3月30日
最近提交 2026年5月26日

部署方式

本地部署

相关项目

Argilla

5.0k · Python
活跃

Argilla 是面向 AI 工程师和领域专家的协作平台,支持构建高质量数据集、人工反馈收集与模型评估。

evaluationdata-processingllm +2

Weave

1.1k · Python
活跃

Weights & Biases 推出的 AI 应用开发工具包,提供 LLM 调用追踪、评估实验管理和版本化能力,助力 AI 应用从原型到生产的全流程管理。

observabilityevaluationllm +2

PrompToMatix

957 · Python
活跃

Salesforce AI Research 推出的自动提示词优化框架,利用 LLM 自动搜索和优化提示词以提升模型性能。

prompt-engineeringevaluationllm +1

SwanLab

4.0k · Python
活跃

开源的现代设计 AI 训练追踪与可视化工具,支持 PyTorch、Transformers 等主流框架,帮助开发者监控和评估 AI Agent 的训练过程。

pythonobservabilityevaluation +2
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community