AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
首页 / 项目 / PyMuPDF

PyMuPDF

活跃
GitHub Python AGPL-3.0

简介

High-performance Python library for data extraction, analysis, conversion and manipulation of PDF and other document formats.

标签

python rag tools data-processing api

分类

📚 RAG 工具
访问 GitHub

项目指标

Stars 9.5k
Forks 713
Watchers 60
Issues 56
创建时间 2012年10月6日
最近提交 2026年4月18日

部署方式

本地部署

相关项目

PDFMathTranslate

33.2k · Python
活跃

AI-powered PDF scientific paper translation with preserved formats, supporting Google/DeepL/Ollama/OpenAI services via CLI/GUI/MCP/Docker/Zotero.

ragpythontools +2

Docstrange

1.4k · Python
活跃

Extract and convert data from any document (PDFs, images, Word, PPT, URLs) into multiple formats including Markdown, JSON, and CSV.

pythonragtools +2

MinerU

60.4k · Python
活跃

Transforms complex documents like PDFs into LLM-ready markdown/JSON for Agentic workflows, supporting layout analysis, formula recognition, and table extraction.

data-processingragpython +2

RAG Techniques

26.9k · Jupyter Notebook
活跃

A comprehensive showcase of advanced Retrieval-Augmented Generation (RAG) techniques with detailed notebook tutorials and code examples, covering foundational to cutting-edge RAG implementations.

ragpythonprompt-engineering +1
AgentList

开源机器人/Agent 项目导航站

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community