AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 Crawlee

Crawlee

活跃
GitHub TypeScript Apache-2.0

简介

Crawlee 是一个面向 Node.js 的 Web 爬取和浏览器自动化库,支持 Puppeteer、Playwright、Cheerio 等多种引擎,专为构建可靠的爬虫而设计,可提取 HTML、PDF 等数据用于 AI、LLM 和 RAG 应用。

标签

typescript javascript data-processing tools rag automation

分类

📚 RAG 工具 ⚡ Agent 工具
访问 GitHub

项目指标

Stars 23.7k
Forks 1.4k
Watchers 23.7k
Issues 173
创建时间 2016年8月26日
最近提交 2026年6月2日

部署方式

本地部署

相关项目

Parsr

6.2k · JavaScript
正常

将 PDF、文档和图片转换为结构化数据的文档处理管道,支持表格识别、阅读顺序还原和 Markdown 输出。

javascriptragtools +2

Docstrange

1.5k · Python
不活跃

通用文档格式转换工具,支持从 PDF、图片、Word、PPT 等提取数据并转换为 Markdown、JSON、CSV 等多种格式。

pythonragtools +2

Zerox

12.2k · TypeScript
不活跃

基于视觉模型的 OCR 与文档提取工具,支持将 PDF、图片等文档高效转换为结构化文本。

typescriptragtools +2

WrenAI

15.4k · Python
活跃

WrenAI 是一个开源的 Text-to-SQL 和 Text-to-Chart GenBI Agent,内置语义层,支持用自然语言查询数据库,自动生成 SQL 语句和可视化图表,兼容 PostgreSQL、BigQuery、Snowflake 等十余种数据源。

llmtypescriptagent +2
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community