OpenRLHF

相关项目

ART

9.4k · Python

活跃

ART（Agent Reinforcement Trainer）是一个使用 GRPO 算法训练多步 Agent 的强化学习框架，支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。

reinforcement-learningagent-trainingGRPO +3

AgentScope

25.0k · Python

活跃

阿里巴巴开源的多 Agent 框架，支持可观测、可理解的 Agent 构建与运行，提供丰富的分布式 Agent 能力。

agent-frameworkmulti-agentdistributed +2

Pearl

3.0k · Jupyter Notebook

活跃

Meta 应用强化学习团队开发的生产级强化学习 AI 智能体库，提供丰富的算法实现和工业级应用支持。

reinforcement-learningmetaproduction +2

Agent Lightning

17.2k · Python

活跃

Agent Lightning 是微软开源的 AI Agent 训练框架，通过强化学习提升 Agent 能力。

agent-trainingreinforcement-learningllm +2