OpenRLHF
活跃简介
OpenRLHF 是一个高性能的 Agent 强化学习框架,基于 Ray 和 vLLM 提供 PPO、DAPO、REINFORCE++ 等算法,支持 Agent 和 VLM 的大规模训练。
OpenRLHF 是一个高性能的 Agent 强化学习框架,基于 Ray 和 vLLM 提供 PPO、DAPO、REINFORCE++ 等算法,支持 Agent 和 VLM 的大规模训练。
ART(Agent Reinforcement Trainer)是一个使用 GRPO 算法训练多步 Agent 的强化学习框架,支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。
阿里巴巴开源的多 Agent 框架,支持可观测、可理解的 Agent 构建与运行,提供丰富的分布式 Agent 能力。
Agent Lightning 是微软开源的 AI Agent 训练框架,通过强化学习提升 Agent 能力。
Flexible and powerful framework for managing multiple AI agents and handling complex conversations across providers like OpenAI, Anthropic, and AWS Bedrock.