AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 PyMuPDF

PyMuPDF

活跃
GitHub Python AGPL-3.0

简介

高性能 Python PDF 处理库,支持数据提取、分析、转换和操作,是 RAG 系统中文档解析的核心工具。

标签

python rag tools data-processing api

分类

📚 RAG 工具
访问 GitHub

项目指标

Stars 9.7k
Forks 720
Watchers 9.7k
Issues 58
创建时间 2012年10月6日
最近提交 2026年5月11日

部署方式

本地部署

相关项目

SAG

1.1k · Python
不活跃

SQL驱动的RAG引擎,在查询时自动构建知识图谱,将SQL查询能力与RAG检索增强生成深度结合,提供高效的知识检索体验。

pythonragtools +2

Airweave

6.3k · Python
活跃

开源的 AI Agent 上下文检索层,支持从多种数据源自动提取、索引和检索结构化上下文信息,帮助 AI Agent 更准确地理解和利用企业知识库。

pythonragagent +2

Modular RAG MCP Server

889 · Python
正常

模块化RAG系统与MCP Server架构的结合,通过Skill引导AI按照规范逐步完成代码,实现100%由AI生成的RAG系统。

pythonragmcp +2

Docstrange

1.5k · Python
不活跃

通用文档格式转换工具,支持从 PDF、图片、Word、PPT 等提取数据并转换为 Markdown、JSON、CSV 等多种格式。

pythonragtools +2
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community