AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 Parsr

Parsr

正常
GitHub JavaScript Apache-2.0

简介

将 PDF、文档和图片转换为结构化数据的文档处理管道,支持表格识别、阅读顺序还原和 Markdown 输出。

标签

javascript rag tools data-processing automation

分类

📚 RAG 工具
访问 GitHub

项目指标

Stars 6.2k
Forks 324
Watchers 6.2k
Issues 72
创建时间 2019年8月5日
最近提交 2026年3月20日

部署方式

本地部署

相关项目

Crawlee

23.6k · TypeScript
活跃

Crawlee 是一个面向 Node.js 的 Web 爬取和浏览器自动化库,支持 Puppeteer、Playwright、Cheerio 等多种引擎,专为构建可靠的爬虫而设计,可提取 HTML、PDF 等数据用于 AI、LLM 和 RAG 应用。

typescriptjavascriptdata-processing +3

Unstract

6.6k · Python
活跃

Unstract 是一个由 LLM 驱动的非结构化数据提取平台,专为 API 部署和 ETL 管道工作流而设计。支持从文档、PDF、图片等非结构化数据源中智能提取结构化信息,构建自动化数据处理管道。

data-processingragpython +3

SAG

1.1k · Python
不活跃

SQL驱动的RAG引擎,在查询时自动构建知识图谱,将SQL查询能力与RAG检索增强生成深度结合,提供高效的知识检索体验。

pythonragtools +2

Airweave

6.4k · Python
活跃

开源的 AI Agent 上下文检索层,支持从多种数据源自动提取、索引和检索结构化上下文信息,帮助 AI Agent 更准确地理解和利用企业知识库。

pythonragagent +2
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community