OpenClaw-RL
活跃简介
通过对话训练任意 Agent 的强化学习框架,支持技能学习与 OpenClaw 生态集成。
通过对话训练任意 Agent 的强化学习框架,支持技能学习与 OpenClaw 生态集成。
ART(Agent Reinforcement Trainer)是一个使用 GRPO 算法训练多步 Agent 的强化学习框架,支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。
面向企业的多 Agent 协作平台,可组建 Agent 团队完成复杂业务流程自动化。
Meta 应用强化学习团队开发的生产级强化学习 AI 智能体库,提供丰富的算法实现和工业级应用支持。
OpenRLHF 是一个高性能的 Agent 强化学习框架,基于 Ray 和 vLLM 提供 PPO、DAPO、REINFORCE++ 等算法,支持 Agent 和 VLM 的大规模训练。