ElevenLabs Python SDK
活跃简介
ElevenLabs Python SDK 是官方提供的 Python 客户端库,用于访问语音 AI 服务。支持文本转语音、语音克隆和 Conversational AI Agent。
核心特性
- 多种 TTS 模型:Eleven v3(70+ 语言)、Multilingual v2(29 种语言)、Flash v2.5(超低延迟)
- 从音频样本即时克隆语音
- 实时音频流传输,适用于低延迟应用
- 对话式 AI Agent,支持自定义工具注册和异步调用
- Speech Engine 用于构建基于 WebSocket 的服务端语音 Agent
- 异步客户端,适用于生产环境中的非阻塞 API 调用
适用场景
💡 构建支持自然多说话人对话的语音 AI 助手
💡 使用克隆或自定义语音创建有声读物和旁白
💡 开发超低延迟的实时语音聊天应用
💡 将文本转语音集成到客户服务自动化中
💡 构建具备工具调用能力的对话式 AI Agent
标签
分类
快速开始
1. 安装:pip install elevenlabs。2. 将 API Key 设置为 ELEVEN_API_KEY 环境变量,或传入 ElevenLabs()。3. 文本转语音:elevenlabs.text_to_speech.convert(text='Hello world', voice_id='JBFqnCBsd6RMkjVDRZzb', model_id='eleven_v3')。4. 流式传输:使用 elevenlabs.text_to_speech.stream() 并遍历 chunks。5. 对话式 Agent:创建 Conversation 并指定 agent_id 和 DefaultAudioInterface。