Maxun
活跃简介
Maxun 是开源的无代码网页数据平台,支持录制式抓取与 LLM 自然语言抽取,可将任意网站转为结构化 API 与定时任务。
核心特性
- 录制式抓取 — 录制浏览器操作自动生成可复用的抽取机器人
- LLM 自然语言抽取 — 用自然语言描述目标,由大模型驱动结构化抽取
- 多模式爬虫 — Extract / Scrape / Crawl / Search 四类机器人覆盖常见数据需求
- 定时与 API 输出 — 支持 cron 调度、RESTful 端点、Sheets/Airtable 导出
- MCP 集成 — 内置 Model Context Protocol 服务,可被 Claude Desktop 等客户端直接调用
- 自适应布局变化 — 网站结构变动时自动恢复抽取流程
适用场景
💡 销售线索生成机器人按区域抓取企业目录与联系信息
💡 市场研究 Agent 跨站点聚合竞品价格、库存与评分
💡 为 RAG 流水线持续喂入结构化 Markdown 文档
💡 监控 Agent 按 cron 跟踪监管机构、新闻、社交舆情变化
💡 处理需要登录的 SaaS 仪表盘数据导出(CRM、客服后台)
快速开始
# 启动 docker compose stack
git clone https://github.com/getmaxun/maxun
cd maxun
docker compose up -d
# 或直接使用 SDK 创建机器人
npm install @maxun/sdk
const { Maxun } = require('@maxun/sdk');
const client = new Maxun({ apiKey: 'YOUR_KEY' });
const robot = await client.createExtractRobot({
url: 'https://example.com',
selectors: { title: 'h1', price: '.price' }
});
const run = await robot.run();