ElevenLabs Python SDK

活跃

GitHub Python MIT

简介

ElevenLabs Python SDK 是官方提供的 Python 客户端库，用于访问语音 AI 服务。支持文本转语音、语音克隆和 Conversational AI Agent。

核心特性

多种 TTS 模型：Eleven v3（70+ 语言）、Multilingual v2（29 种语言）、Flash v2.5（超低延迟）
从音频样本即时克隆语音
实时音频流传输，适用于低延迟应用
对话式 AI Agent，支持自定义工具注册和异步调用
Speech Engine 用于构建基于 WebSocket 的服务端语音 Agent
异步客户端，适用于生产环境中的非阻塞 API 调用

适用场景

💡 构建支持自然多说话人对话的语音 AI 助手

💡 使用克隆或自定义语音创建有声读物和旁白

💡 开发超低延迟的实时语音聊天应用

💡 将文本转语音集成到客户服务自动化中

💡 构建具备工具调用能力的对话式 AI Agent

分类

⚡ Agent 工具

快速开始

1. 安装：pip install elevenlabs。2. 将 API Key 设置为 ELEVEN_API_KEY 环境变量，或传入 ElevenLabs()。3. 文本转语音：elevenlabs.text_to_speech.convert(text='Hello world', voice_id='JBFqnCBsd6RMkjVDRZzb', model_id='eleven_v3')。4. 流式传输：使用 elevenlabs.text_to_speech.stream() 并遍历 chunks。5. 对话式 Agent：创建 Conversation 并指定 agent_id 和 DefaultAudioInterface。

访问 GitHub

ElevenLabs Python SDK

简介

核心特性

适用场景

标签

分类

快速开始

相关项目

ElevenLabs Python SDK

Vision Agents

FastRTC

ComfyUI LLM Party