Pydoll
正常简介
Pydoll 是无 WebDriver 的 Chromium 自动化库,通过 CDP 直连实现反检测与结构化数据提取,适合爬虫与 AI Agent 场景。
核心特性
- 无 WebDriver 直连 — 通过 WebSocket 与 Chrome DevTools Protocol 通信,无需驱动二进制
- 反检测与拟人化 — 内置鼠标轨迹模拟、人类化打字节奏与指纹偏好控制
- Pydantic 结构化提取 — 用 Pydantic 模型定义字段,直接映射 DOM 为强类型对象
- 网络拦截与监控 — 可拦截广告/追踪请求,监听流量以发现隐藏 API
- Shadow DOM 与跨域 iframe — 完全支持封闭 Shadow Root 与跨源 iframe 的查询与交互
- 全异步与类型化 — 基于 asyncio 构建,mypy 100% 类型检查覆盖
适用场景
💡 抓取受 Cloudflare 或其他反爬保护的目标网站
💡 为 AI Agent 提供拟人化的浏览器交互能力
💡 批量监控网页变化或舆情数据
💡 自动化电商或 SaaS 网站的后台操作
💡 自动填写并提交在线表单
分类
快速开始
pip install pydoll-python
import asyncio
from pydoll.browser import Chrome
async def main():
async with Chrome() as browser:
tab = await browser.start()
await tab.go_to("https://example.com")
title = await tab.title
print(f"页面标题: {title}")
asyncio.run(main())