Python抓取B站评论词云可视化(一看就会)

前言

大家好,我是南南

众所周知,作为一个单身lsp,b站舞蹈区探花,咳咳咳,直接进入正题吧

由于内容过多,爬虫代码csdn上有很多篇博客讲解,我就不写了(我是不会告诉你是我懒的)

视频地址:BV12q4y1S7j9

爬完的数据是一个xlsx文件点我下载,我们直接开始数据分析吧!

提取评论写入txt文档

# -*- coding:utf-8 -*-import refrom openpyxl import load_workbook#打开一个新文件wb = load_workbook(filename = r"C:\Users\Administrator\Desktop\ss.xlsx")data = open("b.txt",'w',encoding="utf-8")#建立文档ws.delete_rows(1)#删除第一行\ws = wb.get_sheet_by_name('sheet1')#打开工作表1first_column = ws['D']#第四列for i in range(len(first_column)): print(first_column[i].value,file=data) #读取单元格内容并存储为文本

导入相关库

#!/usr/bin/python# encoding: UTF-8import reimport jiebaimport wordcloudimport pyecharts.options as optsimport pandas as pd

文本转列表

result=[]with open('b.txt', encoding='utf-8') as f: for line in f: result.append(line.strip('\n').split(',')[0])print(result)#下面是对读取到的数组进行变化result_gai = []a = 0for i in result: while(a%2 == 0): pos = i.find(':') #查找某一个字符在在字符串的位置 result_gai.append(i[pos+1:]) break a+=1print(result_gai)

去除符号

res = ''.join(result_gai).replace('\xa0', '').replace('\ufeff', '').replace('\r', '')print(res)

词云可视化

from wordcloud import WordCloudwordcloud = WordCloud(font_path="msyh.ttc",background_color='white').generate(string)#定义字体和背景色%pylab inlineimport matplotlib.pyplot as pltplt.imshow(wordcloud, interpolation='bilinear')plt.axis("off")

运行结果

写在最后

感觉python还是蛮简单的,有兴趣的可以学一学python基础语法

(0)

相关推荐

  • 今天来聊聊求职需要的 Python 技能

    每年的 3.4 月份都是金三银四跳槽季,企业一般也会选择在这个时期调整职工的薪资,小伙伴在这个时候也会心里痒痒,在招聘网站上看看是否有合适的机会,需要的 Python 技能是否符合年限等等情况.这里以 ...

  • 实战!Python 偷偷告诉你小姐姐的听歌喜好

    来源:Python 技术「ID: pythonall」 作为网易云村的深度用户,网易云音乐应该是我除了微信外打开时间最长的 App 了.并不是应为网易云上面的歌曲多,而是因为那些走心的评论.边听歌边刷 ...

  • 实战!用 Python 给母亲送祝福!

    来源:Python 技术「ID: pythonall」 今天是母亲节,小阿酱在这里祝天下所有的母亲节日快乐,作为女儿的我除了买礼物送惊喜外还要用 Python 送上特殊的祝福! 母亲节(Mother' ...

  • DayDayUp:寒门女孩考入北大→换角度看待表达《感谢贫穷》—关于吃苦与穷~~~Python之wordcloud词云图可视化

    DayDayUp:寒门女孩考入北大→换角度看待表达<感谢贫穷>-关于吃苦与穷~~~Python之wordcloud词云图可视化 目录 博主看法-关于吃苦与穷 大多数人对吃苦的含义,理解的太 ...

  • 如何利用“wordcloud+jieba”制作中文词云?

    如何利用"wordcloud+jieba"制作中文词云? 词云又叫文字云,它可以统计文本中频率较高的词,并将这些词可视化,让我们可以直观的了解文本中的重点词汇(词的频率越高,词显示 ...

  • Python抓取必应搜索背景图片

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于编码珠玑 ,作者刘亚曦 Python爬虫.数据分析.网站开发等案例教程视频免费在线观 ...

  • 用 Python 抓取公号文章保存成 PDF

    今天为大家介绍如何将自己喜欢的公众号的历史文章转成 PDF 保存到本地.前几天还有朋友再问,能不能帮把某某公众号的文章下载下来,因为他很喜欢这个号的文章,但由于微信上查看历史文章不能排序,一些较早期的 ...

  • 用 Python 抓取公号文章保存成 HTML

    上次为大家介绍了如果用 Python 抓取公号文章并保存成 PDF 文件存储到本地.但用这种方式下载的 PDF 只有文字没有图片,所以只适用于没有图片或图片不重要的公众号,那如果我想要图片和文字下载下 ...

  • Python 抓取知乎几千张小姐姐图片是什么体验?

    来源:Python 技术「ID: pythonall」 知乎上有许多关于颜值.身材的话题,有些话题的回复数甚至高达几百上千,拥有成千上万的关注者与被浏览数.如果我们在摸鱼的时候欣赏这些话题将花费大量的 ...

  • Python 抓取网页乱码原因分析

    在用 python2 抓取网页的时候,经常会遇到抓下来的内容显示出来是乱码. 发生这种情况的最大可能性就是编码问题:运行环境的字符编码和网页的字符编码不一致. 比如,在 windows 的控制台(gb ...

  • 『爬虫四步走』手把手教你使用Python抓取并存储网页数据!

    爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...

  • 「爬虫四步走」手把手教你使用Python抓取并存储网页数据

    爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程.如果你还在入门爬虫 ...

  • 利用python抓取页面数据

    利用python抓取页面数据

  • 【视频】抓包小练习-B站评论数据抓取

    案例 https://bangumi.bilibili.com/anime/6301/play#113081 视频 代码 import requests import json #获取oiddef g ...