OpenAI Realtime Agents

不活跃
GitHub TypeScript MIT

简介

OpenAI Realtime Agents 是基于 Realtime API 构建的高级 Agent 模式演示项目,展示了实时语音交互、多 Agent 协作等最佳实践。

核心特性

  • Chat-Supervisor 模式:轻量级实时聊天 Agent 处理基础任务,由更智能的文本 Supervisor 模型处理复杂工具调用
  • Sequential Handoff 模式:专业化的 Agent 之间相互转移用户以处理特定意图,灵感来自 OpenAI Swarm
  • 基于 OpenAI Agents SDK 构建,提供统一的 Agent 编排、状态管理和事件处理
  • 通过 OpenAI Realtime API 实现低延迟流式语音交互
  • 可扩展的多 Agent 协作,支持 guardrails、handoffs 和工具使用
  • 可配置的决策边界,支持从文本 Agent 逐步迁移到实时 Agent

适用场景

💡 客户服务语音 Agent,使用聊天 Agent 处理日常咨询,将复杂问题升级给专家 Supervisor
💡 使用 Sequential Handoff 模式在 20 分钟内快速搭建多 Agent 实时语音应用原型
💡 构建语音 AI 助手,结合快速对话响应和高智能工具调用能力
💡 通过复用 Supervisor 层的提示词和工具,将现有文本聊天 Agent 逐步迁移到语音

快速开始

1. 克隆仓库并安装依赖 `npm i`
2. 将 OPENAI_API_KEY 添加到 `.env`(从 `.env.sample` 复制)
3. 运行 `npm run dev` 并打开 http://localhost:3000
4. 从右上角下拉菜单选择场景,体验 Chat-Supervisor 或 Sequential Handoff 模式

相关项目

相关文章