Haystack

活跃
GitHub MDX Apache-2.0

简介

Haystack 是企业级 RAG 与搜索应用框架,支持文档处理、检索、生成与评估全链路。

核心特性

  • 模块化管道架构 — 通过有向无环图组合检索、路由、记忆和生成组件,支持条件分支与循环
  • 模型与供应商无关 — 无缝切换 OpenAI、Anthropic、Cohere、Hugging Face、AWS Bedrock 等,无需重写系统
  • 上下文工程控制 — 显式控制信息检索、排序、过滤、组合和路由,确保上下文质量和可追溯性
  • 可扩展组件生态 — 通过一致接口构建和共享自定义组件,社区与第三方可轻松扩展
  • 内置评估与可观测性 — 提供评估管道对 RAG 输出进行端到端测试和质量度量
  • 生产就绪部署 — 支持 Docker 容器化,提供企业级 Haystack Enterprise 平台

适用场景

💡 企业知识库检索增强生成(RAG):连接内部文档库,支持多轮对话问答
💡 语义搜索引擎:构建基于向量嵌入的语义检索系统,替代传统关键词搜索
💡 多模态问答系统:结合文本和图像检索,支持跨模态文档问答
💡 自主 Agent 工作流:使用 Agent 组件调用外部工具,执行多步骤推理任务
💡 文档分类与信息抽取:利用管道组件对非结构化文档进行结构化信息提取

快速开始

```bash
pip install haystack-ai
```

相关项目

相关文章