Milvus
活跃简介
Milvus 是一个高性能的开源向量数据库,专为 AI 应用程序构建。支持大规模向量数据的存储、索引和相似度搜索,适用于 RAG、推荐系统等场景。
核心特性
- 高性能向量搜索 — 支持 HNSW、IVF、FLAT、DiskANN 等索引类型,CPU/GPU 硬件加速
- 分布式架构 — 计算与存储分离,K8s 原生架构,支持水平扩展和高可用
- 多租户支持 — 数据库、集合、分区级别隔离,支持数百万租户
- 混合搜索 — 向量搜索与标量过滤结合,支持元数据过滤和范围搜索
- Milvus Lite — 轻量级 Python 库,pip install 即可在本地快速启动
- 实时流式更新 — 支持实时数据插入和索引更新,保持数据新鲜
适用场景
💡 构建大规模 RAG 系统,为大语言模型提供外部知识检索
💡 实现推荐系统中的相似物品检索和个性化推荐
💡 构建多模态搜索系统,支持文本、图像等非结构化数据的相似度搜索
💡 部署企业级语义搜索引擎,支持十亿级向量的实时查询
💡 搭建 AI 应用的向量存储基础设施,管理嵌入向量和元数据
分类
快速开始
# 安装 pymilvus
pip install -U pymilvus
# 使用 Milvus Lite 创建本地向量数据库
from pymilvus import MilvusClient
client = MilvusClient("milvus_demo.db")
# 创建集合
client.create_collection(
collection_name="demo",
dimension=768,
)
# 插入数据
client.insert(collection_name="demo", data=data)
# 向量搜索
res = client.search(
collection_name="demo",
data=query_vectors,
limit=5,
)