Pearl

活跃

GitHub Jupyter Notebook MIT

简介

Meta 应用强化学习团队开发的生产级强化学习 AI 智能体库，提供丰富的算法实现和工业级应用支持。

核心特性

模块化设计，支持灵活组合组件构建智能体
动态动作空间与离线学习能力
智能神经探索，适应稀疏反馈环境
安全决策支持带安全约束的 Actor-Critic 算法
历史摘要与数据增强提升生产环境鲁棒性
组件可通过 PyTorch state dict 序列化，支持模型持久化

适用场景

💡 构建随时间从用户交互中学习的推荐系统

💡 带安全约束的竞价拍卖优化

💡 基于 RL Agent 的创意选择与 A/B 测试

💡 上下文赌博机和序列决策的研究

💡 在有限可观察性环境中部署 RL Agent

分类

🤖 Agent 框架

快速开始

1. 克隆仓库并安装：git clone https://github.com/facebookresearch/Pearl.git && cd Pearl && pip install -e . 2. 创建 PearlAgent，配置策略学习器（如 DeepQLearning）和经验回放缓冲区。3. 连接环境，调用 agent.reset()，然后循环：agent.act()、env.step()、agent.observe()、agent.learn()。参考教程了解推荐系统、上下文赌博机和 Frozen Lake 示例。

访问 GitHub

Pearl

简介

核心特性

适用场景

标签

分类

快速开始

相关项目

ART

Hive

Habitat Lab

OpenClaw-RL