相关项目
Agents Towards Production
20.6k · Jupyter Notebook
端到端的代码优先教程,教授如何构建生产级 GenAI 智能体,涵盖从原型到企业级部署的完整流程。
agentframeworkevaluation +2
Argilla
5.0k · Python
Argilla 是面向 AI 工程师和领域专家的协作平台,支持构建高质量数据集、人工反馈收集与模型评估。
evaluationdata-processingllm +2
Hugging Face Evaluate
2.5k · Python
Hugging Face 官方模型与数据集评估库,提供丰富的评估指标和方法,轻松评估机器学习模型性能和数据集质量。
evaluationllmpython +2
12 Factor Agents
22.9k · TypeScript
探讨构建生产级 LLM 驱动软件的核心原则,总结出使智能体应用达到生产可用标准的十二个关键要素。
agentframeworkevaluation +2