当 python 遇到你的微信的时候,你才发现原来你的微信好友是这样的
今天
小帅b来跟你玩玩
爬取微信好友
然后做一顿分析
其实
关于微信好友的爬取分析
挺早之前小帅b就分享过类似的了
但是那会
帅b我更多的是装逼
有些细节没跟你好好说说
导致有些 b 友有点懵逼
那么到现在
我想是个不错的时机了
到什么阶段就干什么事情
而且
前两篇也是写到和微信相关的
所以索性就再写一篇吧
这次
应该能让你更加容易
明白其中的道理
废话不多说
接下来就是
学习 python 的正确姿势
我们打开微信网页版本
https://wx2.qq.com
打开浏览器
可以看到一开始要
我们使用二维码登录
来看看究竟做了什么操作
打开浏览器的开发者模式
可以看到
一开始会得到一个二维码的图片
然后就开始
一顿轮询判断你是否扫码登录
我们点进去看一下
这个接口的具体请求
这个链接主要是携带了二维码的 uuid
以及一些必要的参数
https://login.wx.qq.com/cgi-bin/mmwebwx-bin/login?loginicon=true&uuid=Yc5DKYxsrA==&tip=0&r=-215826228&_=1559288877820
当我们没有扫码登录的时候
返回的是 408
接着打开手机的微信
扫码之后就返回 201 了
接着在手机点一下登录就可以进去了
可以看到 getContact 这个接口
一看名称就知道是获取联系人的
看下返回的数据
是一个 Json
联系人被封装到这个 MemberList 数组里面了
再来
发个消息看看
数据的同步
至此
我们已经摸清了
微信网页版的具体流程了
具体是这样的
第一步
打开微信网页版首页
然后分配一个随机的 UUID
第二步
根据 UUID 获取二维码的图片
第三步
手机微信扫码这个二维码
然后确认登录
第四步
浏览器一直不停的调用同一个接口
看看是否登录
登陆的话就开始调用登录接口
第五步
获取到所有联系人的信息
第六步
可以开始向联系人发送消息
然后就不断的调用同步接口
用来获取最新的消息
知道了这些之后
我们就可以使用 python 来操作微信了
不过
你不知道这些也没关系
因为 itchat 模块早已封装了一切
我们可以使用 itchat 来进行模拟登录
然后获取到自己的好友信息
调用 itchat 的 get_friends 就会得到
好友的列表信息
具体到每个 friend 是这样的
可以看到
每个 item 里面都有好友的具体信息
包括昵称,头像,性别,地址等等
其中的 sex 字段
1 表示男的
2 表示女的
0 表示未知
来分析一波吧
将获得的 friends 这个列表中
把 sex 这个字段的数据拿出来
map(lambda x: x['Sex'], friends[1:])
然后我们再将它转化为 list
sexs = list(map(lambda x: x['Sex'], friends[1:]))
有了 sexs 这个列表之后
我们就可以通过 count 函数
来获取每个性别的人数
从而算出比例了
比如男性所占的比例如下
('小哥哥', sexs.count(1)/sum)
接着使用 pyecharts 这个模块的 Pie
来画个饼图吧
pie = Pie()
pie.add("", [('小哥哥', sexs.count(1)/sum), ('小姐姐', sexs.count(2)/sum), ('未知', sexs.count(0)/sum)])
pie.set_global_opts(title_opts=opts.TitleOpts(title="帅b的朋友性别比例"))
pie.render('sex.html')
运行一波
知道真相的我
眼泪掉下来
咱也不知道
还有多少是伪装成女的
咱也不敢问呐
再来分析个吧
看看小帅b的py们都是在哪里的
将 friends 列表里的 province 拿出来
map(lambda x: x['Province'], friends[1:])
再转化成 list
province = list(map(lambda x: x['Province'], friends[1:]))
接着创建两个列表
keys = []
values = []
一个用来放省份的名称
一个用来存放对应身份的数量
for i in set(province):
keys.append(i)
values.append(province.count(i))
接着就可以通过 zip 函数
将两个列表的数据转化成元组序列
lists = list(zip(keys, values))
有了数据之后
就可以通过 pyecharts 的 map 来整个地图了
m = Map()
m.add("小帅b的py们", lists, "china")
m.set_global_opts(title_opts=opts.TitleOpts(title="小帅b的py们都在哪里?"), visualmap_opts=opts.VisualMapOpts(max_=200))
m.render('location.html')
运行一波
可以发现
广东人最多
也是
毕竟小帅b就是广东人
然而
全中国小帅b就差青海的 py 了
如果你是青海的