Weaviate

活跃
GitHub Go BSD-3-Clause

简介

Weaviate 是一个开源的向量数据库,支持存储对象和向量,允许将向量搜索与结构化过滤相结合。内置多种向量化模块,支持多模态数据搜索。

核心特性

  • 开源云原生向量数据库,支持在数十亿向量上执行毫秒级语义搜索
  • 内置集成 OpenAI、Cohere、HuggingFace 等向量化模型,也支持导入预计算向量
  • 支持语义搜索、BM25 关键词搜索、图片搜索和高级过滤的混合搜索
  • 内置生成式搜索(RAG)和重排序能力,无需额外工具即可构建 Q&A 系统
  • 生产级特性:多租户、复制、RBAC 权限控制、水平扩展和向量压缩
  • 提供 Python、JavaScript/TypeScript、Java、Go、C# 等多语言客户端库

适用场景

💡 构建企业级 RAG 系统,实现大规模文档的语义检索与智能问答
💡 搭建推荐引擎,基于向量相似度为用户推荐相关内容
💡 实现多模态搜索,支持文本、图片等不同类型数据的统一检索
💡 为聊天机器人和对话系统提供长期记忆和知识检索能力
💡 内容分类与自动标签,利用语义搜索对海量内容进行智能分类

快速开始

创建 docker-compose.yml 配置 Weaviate 和 Model2Vec 向量化服务,运行 docker compose up -d 启动;安装 Python 客户端 pip install -U weaviate-client;连接本地实例,创建 Article 集合并插入文档数据;使用 articles.query.near_text() 执行语义搜索。

相关项目

相关文章