scrapy爬虫怎么跳过没有反应的页面

2025-03-23 10:55:09
推荐回答(2个)
回答1:

爬虫跟踪下一页的方法是自己模拟点击下一页连接,然后发出新的请求。请看: item1 = Item()yield item1item2 = Item()yield item2req = Request(url='下一页的链接', callback=self.parse)yield req 注意使用yield时不要用return语句。

回答2:

设置一个TimeOUT 超了就下一轮就可以了。