题名:
用Python写网络爬虫   / (德) 凯瑟琳·雅姆尔, (澳) 理查德·劳森, Katharine Jarmul, Richard Lawson, 李斌 ,
ISBN:
978-7-115-47967-9 价格: 0.00
载体形态:
196页 24cm
出版发行:
出版地: 北京 出版社: 人民邮电出版社 出版日期: 20180101
内容提要:
本书包括网络爬虫的定义以及如何爬取网站, 如何使用几种库从网页中抽取数据, 如何通过缓存结果避免重复下载的问题, 如何通过并行下载来加速数据抓取, 如何利用不同的方式从动态网站中抽取数据, 如何使用叔叔及导航等表达进行搜索和登录, 如何访问被验证码图像保护的数据, 如何使用Scrapy爬虫框架进行快速的并行抓取, 以及使用Portia的Web界面构建网路爬虫。 
主题词:
软件工具  
中图分类法:
TP311.561 版次: