Python爬虫入门教程 24-100 微医挂号网医生数据抓取

梦想橡皮擦 2019-05-07

编程语言 python 浏览器 page

1. 微医挂号网医生数据写在前面

今天要抓取的一个网站叫做微医网站,地址为 https://www.guahao.com ,我们将通过python3爬虫抓取这个网址,然后数据存储到CSV里面,为后面的一些分析类的教程做准备。本篇文章主要使用的库为pyppeteerpyquery

首先找到 医生列表页

https://www.guahao.com/expert/all/全国/all/不限/p5  

这个页面显示有 75952 条数据 ,实际测试中,翻页到第38页,数据就加载不出来了,目测后台程序猿没有把数据返回,不过为了学习,我们忍了。

image

2. 微医挂号网医生数据页面URL

https://www.guahao.com/expert/all/全国/all/不限/p1
https://www.guahao.com/expert/all/
登录 后评论
下一篇
我是小助手
29259人浏览
2019-07-31
相关推荐
0
1
0
614