Pydoll

正常
GitHub Python MIT

简介

Pydoll 是无 WebDriver 的 Chromium 自动化库,通过 CDP 直连实现反检测与结构化数据提取,适合爬虫与 AI Agent 场景。

核心特性

  • 无 WebDriver 直连 — 通过 WebSocket 与 Chrome DevTools Protocol 通信,无需驱动二进制
  • 反检测与拟人化 — 内置鼠标轨迹模拟、人类化打字节奏与指纹偏好控制
  • Pydantic 结构化提取 — 用 Pydantic 模型定义字段,直接映射 DOM 为强类型对象
  • 网络拦截与监控 — 可拦截广告/追踪请求,监听流量以发现隐藏 API
  • Shadow DOM 与跨域 iframe — 完全支持封闭 Shadow Root 与跨源 iframe 的查询与交互
  • 全异步与类型化 — 基于 asyncio 构建,mypy 100% 类型检查覆盖

适用场景

💡 抓取受 Cloudflare 或其他反爬保护的目标网站
💡 为 AI Agent 提供拟人化的浏览器交互能力
💡 批量监控网页变化或舆情数据
💡 自动化电商或 SaaS 网站的后台操作
💡 自动填写并提交在线表单

快速开始

pip install pydoll-python

import asyncio
from pydoll.browser import Chrome

async def main():
    async with Chrome() as browser:
        tab = await browser.start()
        await tab.go_to("https://example.com")
        title = await tab.title
        print(f"页面标题: {title}")

asyncio.run(main())

相关项目

相关文章