AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 OpenRLHF

OpenRLHF

活跃
GitHub Python Apache-2.0

简介

OpenRLHF 是一个高性能的 Agent 强化学习框架,基于 Ray 和 vLLM 提供 PPO、DAPO、REINFORCE++ 等算法,支持 Agent 和 VLM 的大规模训练。

标签

reinforcement-learning agent-training PPO RLHF distributed python

分类

🤖 Agent 框架
访问 GitHub 访问官网 查看文档

项目指标

Stars 9.5k
Forks 941
Watchers 9.5k
Issues 329
创建时间 2023年7月30日
最近提交 2026年5月7日

部署方式

本地部署

相关项目

ART

9.4k · Python
活跃

ART(Agent Reinforcement Trainer)是一个使用 GRPO 算法训练多步 Agent 的强化学习框架,支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。

reinforcement-learningagent-trainingGRPO +3

AgentScope

25.0k · Python
活跃

阿里巴巴开源的多 Agent 框架,支持可观测、可理解的 Agent 构建与运行,提供丰富的分布式 Agent 能力。

agent-frameworkmulti-agentdistributed +2

Pearl

3.0k · Jupyter Notebook
活跃

Meta 应用强化学习团队开发的生产级强化学习 AI 智能体库,提供丰富的算法实现和工业级应用支持。

reinforcement-learningmetaproduction +2

Agent Lightning

17.2k · Python
活跃

Agent Lightning 是微软开源的 AI Agent 训练框架,通过强化学习提升 Agent 能力。

agent-trainingreinforcement-learningllm +2
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community