LlamaIndex
活跃简介
LlamaIndex 是一个数据框架,用于构建 LLM 应用程序的数据连接层。它提供了强大的 RAG 能力,支持多种数据源和向量数据库。
核心特性
- 数据连接器 — 300+ 集成包连接各类数据源(文件、数据库、API、网页等)
- 向量索引与查询引擎 — 支持多种向量数据库,提供语义搜索和混合检索能力
- Agent 工作流编排 — 基于 Workflows 构建复杂的多步骤 AI Agent 流程
- LlamaParse 文档解析 — 支持 130+ 格式的 agentic OCR 和文档解析
- 结构化数据提取 — 从非结构化文档中提取结构化信息
- 模块化架构 — 核心包与集成包分离,按需安装所需组件
适用场景
💡 构建基于私有文档的 RAG 知识库问答系统
💡 创建多模态文档分析和信息提取流水线
💡 开发具备工具调用能力的自主 AI Agent
💡 搭建企业级数据索引和语义搜索平台
分类
快速开始
# 安装 LlamaIndex 核心和 OpenAI 集成
pip install llama-index llama-index-llms-openai
# 导入模块
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
# 从文档目录加载数据
documents = SimpleDirectoryReader('./data').load_data()
# 构建向量索引
index = VectorStoreIndex.from_documents(documents)
# 创建查询引擎并提问
query_engine = index.as_query_engine()
response = query_engine.query("文档中提到了哪些关键要点?")
print(response)