|
题名:
|
用Python写网络爬虫 / (德) 凯瑟琳·雅姆尔, (澳) 理查德·劳森, Katharine Jarmul, Richard Lawson, 李斌 , |
|
ISBN:
|
978-7-115-47967-9 价格: 0.00 |
|
载体形态:
|
196页 24cm |
|
出版发行:
|
出版地: 北京 出版社: 人民邮电出版社 出版日期: 20180101 |
|
内容提要:
|
本书包括网络爬虫的定义以及如何爬取网站, 如何使用几种库从网页中抽取数据, 如何通过缓存结果避免重复下载的问题, 如何通过并行下载来加速数据抓取, 如何利用不同的方式从动态网站中抽取数据, 如何使用叔叔及导航等表达进行搜索和登录, 如何访问被验证码图像保护的数据, 如何使用Scrapy爬虫框架进行快速的并行抓取, 以及使用Portia的Web界面构建网路爬虫。 |
|
主题词:
|
软件工具 |
|
中图分类法:
|
TP311.561 版次: |