Pearl
活跃简介
Meta 应用强化学习团队开发的生产级强化学习 AI 智能体库,提供丰富的算法实现和工业级应用支持。
Meta 应用强化学习团队开发的生产级强化学习 AI 智能体库,提供丰富的算法实现和工业级应用支持。
ART(Agent Reinforcement Trainer)是一个使用 GRPO 算法训练多步 Agent 的强化学习框架,支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。
OpenRLHF 是一个高性能的 Agent 强化学习框架,基于 Ray 和 vLLM 提供 PPO、DAPO、REINFORCE++ 等算法,支持 Agent 和 VLM 的大规模训练。
Hive 是一个面向生产环境的多 Agent 执行框架,提供状态管理、故障恢复、可观测性和人机协作能力,支持自动生成多 Agent 拓扑来处理复杂业务工作流。
Meta 开发的模块化具身 AI 智能体训练库,支持在多种任务和环境中训练和评估具身智能体。