AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 Docstrange

Docstrange

不活跃
GitHub Python MIT

简介

通用文档格式转换工具,支持从 PDF、图片、Word、PPT 等提取数据并转换为 Markdown、JSON、CSV 等多种格式。

标签

python rag tools data-processing agent

分类

📚 RAG 工具 ⚡ Agent 工具
访问 GitHub

项目指标

Stars 1.5k
Forks 131
Watchers 1.5k
Issues 34
创建时间 2025年7月31日
最近提交 2025年10月31日

部署方式

本地部署

相关项目

LangExtract

36.8k · Python
活跃

Google 开源的 Python 库,用于利用 LLM 从非结构化文本中精确提取结构化信息,支持源文本标注和交互式可视化,适用于数据标注和知识抽取场景。

data-processingllmpython +2

Airweave

6.4k · Python
活跃

开源的 AI Agent 上下文检索层,支持从多种数据源自动提取、索引和检索结构化上下文信息,帮助 AI Agent 更准确地理解和利用企业知识库。

pythonragagent +2

PDFMathTranslate

34.4k · Python
活跃

AI 驱动的 PDF 学术论文翻译工具,完整保留原始排版格式,支持 Google/DeepL/Ollama/OpenAI 等多种翻译引擎。

ragpythontools +2

Crawlee

23.6k · TypeScript
活跃

Crawlee 是一个面向 Node.js 的 Web 爬取和浏览器自动化库,支持 Puppeteer、Playwright、Cheerio 等多种引擎,专为构建可靠的爬虫而设计,可提取 HTML、PDF 等数据用于 AI、LLM 和 RAG 应用。

typescriptjavascriptdata-processing +3
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community