资源链接(亲测有效):https://pan.baidu.com/s/1DX6C5s7FoqGRgl0Cy0iDHw
提取码 1314
作者简介韦玮 ,现任重庆韬翔网络科技有限公司创始人兼CEO,51CTO、CSDN等技术社区特邀专家与讲师,输出了大量的优质文章与课程。
作者简介
韦玮 ,现任重庆韬翔网络科技有限公司创始人兼CEO,51CTO、CSDN等技术社区特邀专家与讲师,输出了大量的优质文章与课程。
简介
为什么写这本书 网络爬虫其实很早就出现了,最开始网络爬虫主要应用在各种搜索引擎中。在搜索引擎 中,主要使用通用网络爬虫对网页进行爬取及存储。 随着大数据时代的到来,我们经常需要在海量数据的互联网环境中搜集一些特定的数据 并对其进行分析,我们可以使用网络爬虫对这些特定的数据进行爬取,并对-一些无关的数据 进行过滤,将目标数据筛选出来。对特定的数据进行爬取的爬虫,我们将其称为聚焦网络爬 虫。在大数据时代,聚焦网络爬虫的应用需求越来越大。 目前在国内Python网络爬虫的书籍基本上都是从国外引进翻译的,国内的本版书籍屈指 可数,故而我跟华章的副总编杨福川策划了这本书。本书的撰写过程中各方面的参考资料非 常少,因此完成本书所花费的精力相对来说是非常大的。 本书从系统化的视角,为那些想学习Python 网络爬虫或者正在研究Python网络爬虫的朋 友们提供了一个全面的参考,让读者可以系统地学习Python网络爬虫的方方面面,在理解并 掌握了本书的实例之后,能够独立编写出自己的Python网络爬虫项目,并且能够胜任Python 网络爬虫工程师相关岗位的工作。 同时,本书的另一个目的是,希望可以给大数据或者数据挖掘方向的从业者-定的参考, 以帮助这些读者从海量的互联网信息中爬取需要的数据。所谓巧妇难为无米之炊,有了这些 数据之后,从事大数据或者数据挖掘方向工作的读者就可以进行后续的分析处理了。 本书的主要内容和特色 本书是一本系统介绍Python网络爬虫的书籍,全书注重实战,涵盖网络爬虫原理、如何 手写Python网络爬虫、如何使用Scrapy框架编写网络爬虫项目等关于Python网络爬虫的方 方面面。
本书的内容和特色
本书是一本系统介绍Python网络爬虫的书籍,全书注重实战,涵盖网络爬虫原理、如何手写Python网络爬虫、如何使用Scrapy框架编写网络爬虫项目等关于Python网络爬虫的方方面面。本书的主要特色如下:口系统讲解Python网络爬虫的编写方法,体系清晰。口结合实战,让读者能够从零开始掌握网络爬虫的基本原理,学会编写Python网络爬虫以及Scrapy爬虫项目,从而编写出通用爬虫及聚焦爬虫,并掌握常见网站的爬虫反屏蔽手段。口有配套免费视频,对于书中的难点,读者可以直接观看作者录制的对应视频,加深理解。口拥有多个爬虫项目编写案例,比如博客类爬虫项目案例、图片类爬虫项目案例、模拟登录爬虫项目等。除此之外,还有很多不同种类的爬虫案例,可以让大家在理解这些案例之后学会各种类型爬虫的编写方法。总之,在理解本书内容并掌握书中实例之后,读者将能胜任Python网络爬虫工程师方向的工作并学会各种类型网络爬虫项目的编写。此外,本书对于大数据或数据挖掘方向的从业者也非常有帮助,比如可以利用Python网络爬虫轻松获取所需的数据信息等。
适合读者
口Python网络爬虫初学者口网络爬虫工程师口大数据及数据挖掘工程师口高校计算机专业的学生口其他对Python或网络爬虫感兴趣的人员