AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
首页 / 项目 / Zerox

Zerox

活跃
GitHub TypeScript MIT

简介

OCR and document extraction tool using vision models, efficiently converting PDFs and images into structured text.

标签

typescript rag tools data-processing llm

分类

📚 RAG 工具
访问 GitHub

项目指标

Stars 12.2k
Forks 840
Watchers 63
Issues 87
创建时间 2024年7月21日
最近提交 2026年4月18日

部署方式

本地部署

相关项目

Crawlee

22.8k · TypeScript
活跃

A web scraping and browser automation library for Node.js to build reliable crawlers, supporting Puppeteer, Playwright, Cheerio, and raw HTTP. Extract data for AI, LLMs, RAG, or GPTs with proxy rotation and both headful and headless modes.

typescriptjavascriptdata-processing +3

MinerU

60.4k · Python
活跃

Transforms complex documents like PDFs into LLM-ready markdown/JSON for Agentic workflows, supporting layout analysis, formula recognition, and table extraction.

data-processingragpython +2

Vane

33.8k · TypeScript
活跃

An AI-powered answering engine with multi-model integration, web search and local knowledge base, providing a Perplexity-like search experience.

ragtypescriptllm +2

PDFMathTranslate

33.2k · Python
活跃

AI-powered PDF scientific paper translation with preserved formats, supporting Google/DeepL/Ollama/OpenAI services via CLI/GUI/MCP/Docker/Zotero.

ragpythontools +2
AgentList

开源机器人/Agent 项目导航站

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community