LlamaIndex

活跃
GitHub Python MIT

简介

LlamaIndex 是一个数据框架,用于构建 LLM 应用程序的数据连接层。它提供了强大的 RAG 能力,支持多种数据源和向量数据库。

核心特性

  • 数据连接器 — 300+ 集成包连接各类数据源(文件、数据库、API、网页等)
  • 向量索引与查询引擎 — 支持多种向量数据库,提供语义搜索和混合检索能力
  • Agent 工作流编排 — 基于 Workflows 构建复杂的多步骤 AI Agent 流程
  • LlamaParse 文档解析 — 支持 130+ 格式的 agentic OCR 和文档解析
  • 结构化数据提取 — 从非结构化文档中提取结构化信息
  • 模块化架构 — 核心包与集成包分离,按需安装所需组件

适用场景

💡 构建基于私有文档的 RAG 知识库问答系统
💡 创建多模态文档分析和信息提取流水线
💡 开发具备工具调用能力的自主 AI Agent
💡 搭建企业级数据索引和语义搜索平台

快速开始

# 安装 LlamaIndex 核心和 OpenAI 集成
pip install llama-index llama-index-llms-openai

# 导入模块
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader

# 从文档目录加载数据
documents = SimpleDirectoryReader('./data').load_data()

# 构建向量索引
index = VectorStoreIndex.from_documents(documents)

# 创建查询引擎并提问
query_engine = index.as_query_engine()
response = query_engine.query("文档中提到了哪些关键要点?")
print(response)

相关项目

相关文章