OpenRLHF

活跃

GitHub Python Apache-2.0

简介

OpenRLHF 是一个高性能的 Agent 强化学习框架，基于 Ray 和 vLLM 提供 PPO、DAPO、REINFORCE++ 等算法，支持 Agent 和 VLM 的大规模训练。

标签

reinforcement-learning agent-training PPO RLHF distributed python

分类

🤖 Agent 框架

访问 GitHub 访问官网查看文档

相关项目

ART

ART（Agent Reinforcement Trainer）是一个使用 GRPO 算法训练多步 Agent 的强化学习框架，支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。

reinforcement-learningagent-trainingGRPO +3

AgentScope

24.0k · Python

阿里巴巴开源的多 Agent 框架，支持可观测、可理解的 Agent 构建与运行，提供丰富的分布式 Agent 能力。

agent-frameworkmulti-agentdistributed +2

Agent Lightning

16.9k · Python

Agent Lightning 是微软开源的 AI Agent 训练框架，通过强化学习提升 Agent 能力。

agent-trainingreinforcement-learningllm +2

Agent Squad

Flexible and powerful framework for managing multiple AI agents and handling complex conversations across providers like OpenAI, Anthropic, and AWS Bedrock.

multi-agentagentframework +4