《Python 3反爬虫原理与绕过实战》
编辑推荐:
本书内容十分详尽,几乎涵盖了市面上所有的反爬虫类型,包括但不限于 Cookie 反爬虫、WebSocket 反爬虫、字体反爬虫、WebDriver 反爬虫、App 反爬虫、验证码反爬虫。书中首先对各类反爬虫技术进行了合理的归类,然后通过剖析多个案例帮助大家理解各类反爬虫技术的原理。另外,书中还针对各类反爬虫给出了对应的绕过和破解方案。这本书干货满满,可以帮助大家全面了解爬虫和反爬虫的各类技术,强烈推荐给大家。 —— 崔庆才 微软小冰工程师 《Python 3 网络爬虫开发实战》作者 在大数据时代,所有公司都离不开数据,而获取数据非常快的方式就是利用爬虫去爬取。随着爬虫的增多,反爬虫水平也在不断提高。本书作者自己搭建了 21 个示例,深入解析了 CSS 偏移、字体反爬虫、JavaScript 混淆、App 逆向、验证码破解和加密算法等知识,并用详细的代码手把手教你如何实现反爬虫以及如何破解反爬虫,让大家真正做到“知其然,知其所以然”。强烈推荐给每一位想要从事爬虫工作,以及希望提高爬虫技术水平的朋友们。 —— 陈祥安 马蜂窝高级工程师 我见证了作者从一个零基础小白逐渐成长为一名出色的爬虫工程师的过程。相信本书不仅是技术满满的干货集,也是他记录成长历程的诚意之作! —— BruceDone 腾讯后端开发工程师
作者介绍:
韦世东,资深爬虫工程师,2019年华为云·云享专家,掘金社区优秀作者,GitChat认证作者,夜幕团队(NightTeam)成员。拥有七年互联网从业经验,擅长反爬虫的设计和绕过技巧。
内容简介:
本书首先介绍了开发环境的配置,接着讨论了Web网站的构成和页面渲染、动态网页和静态网页对爬虫造成的影响,紧接着详细介绍了信息校验型反爬虫、动态渲染反爬虫、文本混淆反爬虫知识、特征识别反爬虫的原理、实现和绕过,然后概览了App数据爬取的关键和常用的反爬虫手段,最后介绍了常见的编码和加密原理、JavaScript代码混淆知识、前端禁止事件以及与爬虫相关的法律知识和风险点。