AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
首页 / 项目 / Docstrange

Docstrange

活跃
GitHub Python MIT

简介

Extract and convert data from any document (PDFs, images, Word, PPT, URLs) into multiple formats including Markdown, JSON, and CSV.

标签

python rag tools data-processing agent

分类

📚 RAG 工具 ⚡ Agent 工具
访问 GitHub

项目指标

Stars 1.4k
Forks 126
Watchers 12
Issues 32
创建时间 2025年7月31日
最近提交 2026年4月17日

部署方式

本地部署

相关项目

LangExtract

35.7k · Python
活跃

A Python library by Google for extracting structured information from unstructured text using LLMs with precise source grounding and interactive visualization, designed for data annotation and knowledge extraction workflows.

data-processingllmpython +2

PDFMathTranslate

33.2k · Python
活跃

AI-powered PDF scientific paper translation with preserved formats, supporting Google/DeepL/Ollama/OpenAI services via CLI/GUI/MCP/Docker/Zotero.

ragpythontools +2

Crawlee

22.8k · TypeScript
活跃

A web scraping and browser automation library for Node.js to build reliable crawlers, supporting Puppeteer, Playwright, Cheerio, and raw HTTP. Extract data for AI, LLMs, RAG, or GPTs with proxy rotation and both headful and headless modes.

typescriptjavascriptdata-processing +3

txtai

12.4k · Python
活跃

集成语义搜索、LLM 编排和语言模型工作流的全能 AI 框架,支持 Agent、RAG 和向量数据库

semantic-searchragembeddings +4
AgentList

开源机器人/Agent 项目导航站

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community