Pearl

相关项目

ART

9.2k · Python

活跃

ART（Agent Reinforcement Trainer）是一个使用 GRPO 算法训练多步 Agent 的强化学习框架，支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。

reinforcement-learningagent-trainingGRPO +3

OpenRLHF

9.4k · Python

活跃

OpenRLHF 是一个高性能的 Agent 强化学习框架，基于 Ray 和 vLLM 提供 PPO、DAPO、REINFORCE++ 等算法，支持 Agent 和 VLM 的大规模训练。

reinforcement-learningagent-trainingPPO +3

Hive

10.1k · Python

活跃

Hive 是一个面向生产环境的多 Agent 执行框架，提供状态管理、故障恢复、可观测性和人机协作能力，支持自动生成多 Agent 拓扑来处理复杂业务工作流。

multi-agentagent-frameworkproduction +3

Habitat Lab

3.0k · Python

正常

Meta 开发的模块化具身 AI 智能体训练库，支持在多种任务和环境中训练和评估具身智能体。