利用Python网络爬虫抓取微信好友的所在省位和城市分布及其可视化

简介: 前几天给大家分享了如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,感兴趣的小伙伴可以点击链接进行查看。今天小编给大家介绍如何利用Python网络爬虫抓取微信好友的省位和城市,并且将其进行可视化,具体的教程如下。

前几天给大家分享了如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,感兴趣的小伙伴可以点击链接进行查看。今天小编给大家介绍如何利用Python网络爬虫抓取微信好友的省位和城市,并且将其进行可视化,具体的教程如下。

爬取微信好友信息,不得不提及这个itchat库,简直太神奇了,通过它访问微信好友基本信息可谓如鱼得水。下面的代码是获取微信好友的省位信息:

img_ec32263ef91282778bb8116ecdc0552d.jpe

程序运行之后,需要扫描进行授权登录,之后在Pycharm的控制台上会出现如下图的红色提示,这些红色的字体并不是我们通常遇到的Python程序运行报错,属于正常的状态,不用太理会。大意是提示你要用手机扫描下载过来的二维码;确认授权;加载通讯录好友信息;登录成功。之后就会将程序中所需要的内容打印出来,如下图所示:

img_6164d5653d6eaa358ead84e89a908fec.jpe

将打印出来的内容放到记事本中,如下图所示:

img_a9b068d7142e35514e58fe0ff0d8a8ee.jpe

可以看到小编的大部分好友都是在中国,而且辽宁的朋友最多,其次是广东省和湖南省的好友居多,可以知道小编是和这三个地方结缘了。下图中展示的省位好友数量并没有那么多,除了青海之外,全部都是国外的城市或国家名称,说明小编的青海朋友并不多,希望可以多交几位青海省的朋友。另外经过统计,小编还发现自己并没有云南、海南和甘肃的朋友,希望可以和这几个地方的伙伴们做个朋友 ~

img_33c1774a4ca36b764fc773bbe13a3a1c.jpe

下图展示的是对好友的地图可视化,具体的实现可以参考这篇文章:Python大佬批量爬取中国院士信息,告诉你哪个地方人杰地灵,在此就不再赘述。

img_06438ac8722adf2fd669023d363084df.jpe

可以看到颜色较深的省位是辽宁省、广东省和湖南省,说明这三个省位小编的好友较多。

接下来继续写代码,抓取微信好友所在的城市,如下图所示:

img_e063086952946e0dcf22e7b1948efe9a.jpe

这里代码和程序运行的截图都放到一起了,在此对于红色字体就不再赘述了。就打印出来的信息可以看到,小编的微信好友中大连的朋友最多,其实是广东省的朋友,如广州和深圳,再就是湖南省的朋友了,如衡阳和长沙。

将微信好友城市分布拷贝到记事本中,可以更加清楚的看到好友的分布,如下图所示:

img_ba15bc56aba72aa4b2e8c5402d10a27d.jpe

还有部分城市如下图所示:

img_2c4d1f66d417c83c37ed23c84f732fd3.jpe

还有一些地区就不再多粘贴出来了。另外,感兴趣的小伙伴可以将城市统计汇总,之后将其做个地图可视化,可以尝试一下噢~~

^_^小编最后祝大家周末愉快^_^

相关文章
|
12天前
|
数据采集 存储 API
网络爬虫与数据采集:使用Python自动化获取网页数据
【4月更文挑战第12天】本文介绍了Python网络爬虫的基础知识,包括网络爬虫概念(请求网页、解析、存储数据和处理异常)和Python常用的爬虫库requests(发送HTTP请求)与BeautifulSoup(解析HTML)。通过基本流程示例展示了如何导入库、发送请求、解析网页、提取数据、存储数据及处理异常。还提到了Python爬虫的实际应用,如获取新闻数据和商品信息。
|
16天前
|
数据采集 Python
【python】爬虫-西安医学院-校长信箱
本文以西安医学院-校长信箱为基础来展示爬虫案例。来介绍python爬虫。
【python】爬虫-西安医学院-校长信箱
|
22天前
|
数据采集 安全 Python
python并发编程:Python实现生产者消费者爬虫
python并发编程:Python实现生产者消费者爬虫
24 0
python并发编程:Python实现生产者消费者爬虫
|
14天前
|
数据采集 大数据 数据安全/隐私保护
掌握网络抓取技术:利用RobotRules库的Perl下载器一览小红书的世界
本文探讨了使用Perl和RobotRules库在遵循robots.txt规则下抓取小红书数据的方法。通过分析小红书的robots.txt文件,配合亿牛云爬虫代理隐藏真实IP,以及实现多线程抓取,提高了数据采集效率。示例代码展示了如何创建一个尊重网站规则的数据下载器,并强调了代理IP稳定性和抓取频率控制的重要性。
掌握网络抓取技术:利用RobotRules库的Perl下载器一览小红书的世界
|
2天前
|
数据采集 存储 JSON
Python爬虫面试:requests、BeautifulSoup与Scrapy详解
【4月更文挑战第19天】本文聚焦于Python爬虫面试中的核心库——requests、BeautifulSoup和Scrapy。讲解了它们的常见问题、易错点及应对策略。对于requests,强调了异常处理、代理设置和请求重试;BeautifulSoup部分提到选择器使用、动态内容处理和解析效率优化;而Scrapy则关注项目架构、数据存储和分布式爬虫。通过实例代码,帮助读者深化理解并提升面试表现。
11 0
|
5天前
|
小程序
uniapp 实现当前页面分享至微信好友或朋友圈功能(带参数和无参数)
uniapp 实现当前页面分享至微信好友或朋友圈功能(带参数和无参数)
6 0
|
5天前
|
数据采集 JavaScript 前端开发
使用Python打造爬虫程序之破茧而出:Python爬虫遭遇反爬虫机制及应对策略
【4月更文挑战第19天】本文探讨了Python爬虫应对反爬虫机制的策略。常见的反爬虫机制包括User-Agent检测、IP限制、动态加载内容、验证码验证和Cookie跟踪。应对策略包括设置合理User-Agent、使用代理IP、处理动态加载内容、验证码识别及维护Cookie。此外,还提到高级策略如降低请求频率、模拟人类行为、分布式爬虫和学习网站规则。开发者需不断学习新策略,同时遵守规则和法律法规,确保爬虫的稳定性和合法性。
|
17天前
|
数据采集 存储 前端开发
Python爬虫如何快速入门
写了几篇网络爬虫的博文后,有网友留言问Python爬虫如何入门?今天就来了解一下什么是爬虫,如何快速的上手Python爬虫。
20 0
|
29天前
|
数据采集 存储 Rust
Rust高级爬虫:如何利用Rust抓取精美图片
Rust高级爬虫:如何利用Rust抓取精美图片
|
12天前
|
小程序 前端开发 API
微信小程序全栈开发中的异常处理与日志记录
【4月更文挑战第12天】本文探讨了微信小程序全栈开发中的异常处理和日志记录,强调其对确保应用稳定性和用户体验的重要性。异常处理涵盖前端(网络、页面跳转、用户输入、逻辑异常)和后端(数据库、API、业务逻辑)方面;日志记录则关注关键操作和异常情况的追踪。实践中,前端可利用try-catch处理异常,后端借助日志框架记录异常,同时采用集中式日志管理工具提升分析效率。开发者应注意安全性、性能和团队协作,以优化异常处理与日志记录流程。

热门文章

最新文章