ElevenLabs Python SDK

活跃
GitHub Python MIT

简介

ElevenLabs Python SDK 是官方提供的 Python 客户端库,用于访问 ElevenLabs 的语音 AI 服务。支持文本转语音、语音克隆、实时流式音频和 Conversational AI Agent,是构建语音 Agent 应用的关键工具。

核心特性

  • 多种 TTS 模型:Eleven v3(70+ 语言)、Multilingual v2(29 种语言)、Flash v2.5(超低延迟)
  • 从音频样本即时克隆语音
  • 实时音频流传输,适用于低延迟应用
  • 对话式 AI Agent,支持自定义工具注册和异步调用
  • Speech Engine 用于构建基于 WebSocket 的服务端语音 Agent
  • 异步客户端,适用于生产环境中的非阻塞 API 调用

适用场景

💡 构建支持自然多说话人对话的语音 AI 助手
💡 使用克隆或自定义语音创建有声读物和旁白
💡 开发超低延迟的实时语音聊天应用
💡 将文本转语音集成到客户服务自动化中
💡 构建具备工具调用能力的对话式 AI Agent

快速开始

1. 安装:pip install elevenlabs。2. 将 API Key 设置为 ELEVEN_API_KEY 环境变量,或传入 ElevenLabs()。3. 文本转语音:elevenlabs.text_to_speech.convert(text='Hello world', voice_id='JBFqnCBsd6RMkjVDRZzb', model_id='eleven_v3')。4. 流式传输:使用 elevenlabs.text_to_speech.stream() 并遍历 chunks。5. 对话式 Agent:创建 Conversation 并指定 agent_id 和 DefaultAudioInterface。

相关项目

相关文章