Pearl

活跃
GitHub Jupyter Notebook MIT

简介

Meta 应用强化学习团队开发的生产级强化学习 AI 智能体库,提供丰富的算法实现和工业级应用支持。

核心特性

  • 模块化设计,支持灵活组合组件构建智能体
  • 动态动作空间与离线学习能力
  • 智能神经探索,适应稀疏反馈环境
  • 安全决策支持带安全约束的 Actor-Critic 算法
  • 历史摘要与数据增强提升生产环境鲁棒性
  • 组件可通过 PyTorch state dict 序列化,支持模型持久化

适用场景

💡 构建随时间从用户交互中学习的推荐系统
💡 带安全约束的竞价拍卖优化
💡 基于 RL Agent 的创意选择与 A/B 测试
💡 上下文赌博机和序列决策的研究
💡 在有限可观察性环境中部署 RL Agent

快速开始

1. 克隆仓库并安装:git clone https://github.com/facebookresearch/Pearl.git && cd Pearl && pip install -e . 2. 创建 PearlAgent,配置策略学习器(如 DeepQLearning)和经验回放缓冲区。3. 连接环境,调用 agent.reset(),然后循环:agent.act()、env.step()、agent.observe()、agent.learn()。参考教程了解推荐系统、上下文赌博机和 Frozen Lake 示例。

相关项目