LanceDB

活跃
GitHub HTML Apache-2.0

简介

开源的多模态嵌入式向量检索库,支持零服务器部署,提供 Lance 列式格式实现高效向量搜索和过滤,适用于 AI Agent 长期记忆与 RAG 场景。

核心特性

  • 毫秒级向量搜索,支持数十亿向量的高性能索引和检索
  • 综合搜索能力:向量相似度搜索、全文搜索和 SQL 查询三合一
  • 多模态支持:存储和查询文本、图像、视频、点云等多种数据类型
  • 零拷贝、自动版本管理,无需额外基础设施即可管理数据版本
  • GPU 加速向量索引构建,大幅提升大规模数据处理性能
  • 丰富的生态集成:LangChain、LlamaIndex、Apache Arrow、Pandas、DuckDB 等

适用场景

💡 为 AI Agent 构建长期记忆存储,支持高效的语义检索和上下文召回
💡 搭建 RAG(检索增强生成)应用,实现多模态知识库问答
💡 构建推荐系统,利用向量相似度进行个性化内容匹配
💡 处理大规模多模态数据集,支持跨模态搜索和分析
💡 作为嵌入式数据库集成到 Python/TypeScript/Rust 应用中,零服务器部署

快速开始

pip install lancedb 安装 Python SDK。使用 import lancedb; db = lancedb.connect('~/.lancedb') 连接本地数据库,table = db.create_table('my_table', data) 创建表并插入数据,results = table.search(query).limit(10).to_pandas() 执行向量搜索。详见 docs.lancedb.com/quickstart。

相关项目