排序
Playwright实战 – 轻松爬取微博热搜数据
本文将以微博热搜榜为例,手把手教你使用Playwright完成数据爬取全流程,适合零基础新手直接复制操作。最终结果将保存为清晰的CSV文件。 代码 const { chromium } = require('playwright'); con...
Playwright爬虫实战 – 破解验证码的常见策略
验证码的主要作用是防止机器人的自动化访问,而通过模拟人类行为,我们可以绕过这些限制。但破解验证码并不简单,需要根据验证码的类型采取不同的策略。 验证码类型及破解策略 验证码类型 但一...
Playwright爬虫实战 – 连接本地浏览器复用登录状态(以知乎为例)
原理概述 本地浏览器复用原理 Playwright 提供了 connectOverCDP 方法,允许我们通过 Chrome DevTools Protocol (CDP) 连接到已打开的浏览器实例。这种方式可以直接复...
Playwright爬虫实战 – 复用登录状态绕过验证码(以知乎为例)
在爬虫开发中,验证码是一个常见的反爬虫手段。对于需要登录的网站(如知乎),每次运行脚本时都需要重新登录,不仅效率低下,还可能触发验证码。本文将详细介绍如何通过复用登录状态,绕过验证...



