OpenClaw-RL

活跃

GitHub Python Apache-2.0

简介

通过对话训练任意 Agent 的强化学习框架，支持技能学习与 OpenClaw 生态集成。

ART（Agent Reinforcement Trainer）是一个使用 GRPO 算法训练多步 Agent 的强化学习框架，支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。

面向企业的多 Agent 协作平台，可组建 Agent 团队完成复杂业务流程自动化。

Meta 应用强化学习团队开发的生产级强化学习 AI 智能体库，提供丰富的算法实现和工业级应用支持。

OpenRLHF 是一个高性能的 Agent 强化学习框架，基于 Ray 和 vLLM 提供 PPO、DAPO、REINFORCE++ 等算法，支持 Agent 和 VLM 的大规模训练。