爬虫干货文章

爬虫常用框架

爬虫模拟浏览器框架

  • Selenium:常用,略
  • Splinter:Python 开发的开源web自动化测试的工具集
  • Spynner:可编程Web浏览器Python模块,支持AJAX,可爬取js动态界面
  • pyppeteer:安装配置的便利性和运行效率方面都要远胜selenium
  • PhantomJS:已停止更新
  • Splash:带有HTTP API的轻量级Web浏览器,常与scrapy搭配使用
  • requests-html:在requests库基础上增加解析HTML的功能

代理爬虫

爬虫辅助工具

Logo

更多推荐