WordCloud词云库实战（二)

2024-05-08 17:45:39

写在前面

昨天我们讲了英文词云绘制，今天我们来试试中文词云，首先我们需要一本道德经

读取文件

#-*- coding:utf-8 -*-with open('C:\\Users\\Administrator\\Desktop\\daode.txt',errors='ignore') as read_file:#读取文本 data=read_file.read() print(data)

读取出来咋用啊，还是逐行读取为字符串吧

data = ''with open('C:\\Users\\Administrator\\Desktop\\daode.txt',errors='ignore') as f:#逐行读取文本为str for line in f.readlines(): line = line.strip() data += line print(data)

去一下标点符号

from string import punctuationstr = data

add_punc='，。、【】“”：；（）《》'’{}？！⑦()、%^>℃：.”“^-——=擅长于的&#@￥' # 去除字符串内的符号

all_punc = punctuation + add_punctemp = []for c in str: if c not in all_punc : temp.append(c)newText = ''.join(temp)print(newText)

去除数字

from string import digitss = newTextremove_digits = str.maketrans('', '', digits)#去除字符串内的数字res = s.translate(remove_digits)print(res)

结巴（jieba）分词

import jiebamytext = " ".join(jieba.cut(res))print(mytext)

可视化

import wordcloudc = wordcloud.WordCloud(background_color='white')#1.配置对象参数,背景色换为白色

wenzi = "He is busy every day. He has many thing to do. He has no time to go home for lunch. He gets home at 7:00 p.m. At home he does the housework. He cooks nice dishes for mother and me."

c.generate(mytext) #2.加载词云文本c.to_file("pywordcloud.png")#3.输出词云文件

懵逼了吧，宝儿，这是因为matplotlib默认字体是不包含中文的，所以我们要给他的参数定义一个字体

import wordcloudc = wordcloud.WordCloud(font_path="msyh.ttc",background_color='white')#1.配置对象参数,背景色换为白色

wenzi = "He is busy every day. He has many thing to do. He has no time to go home for lunch. He gets home at 7:00 p.m. At home he does the housework. He cooks nice dishes for mother and me."

c.generate(mytext) #2.加载词云文本c.to_file("pywordcloud.png")#3.输出词云文件

赞 (0)

C/C++之常用字符串比较总结

C/C++之常用字符串比较总结
Python通过字符串调用函数

有时候我们想通过字符串调用已经定义好的函数,一开始的思路及实现方式如下: def chinese(text): print('jieba分词') def english(text): pr ...
NLP之WordCloud：基于jieba+matplotlib库对一段文本生成词云图~~情人节最好的礼物(给你一张过去的词云图，看看那时我们的爱情)

NLP之WordCloud:基于jieba+matplotlib库对一段文本生成词云图~~情人节最好的礼物(给你一张过去的词云图,看看那时我们的爱情) Python词云图:情人节最好的礼物--给你一张 ...
【每周一坑】选择困难的农药召唤师

昏暗的王者峡谷丛林中,窜动着一个忙碌的身影.辛勤的韩信走过一个个月牙形的谷地,青筋爆出的手背,淌着红色鲜血的透甲枪,无双国士驰骋在危机四伏的森林里. 正义,不过是胜利的又一个别称! 手起,枪出,冰冷的 ...
你们公司今年会发年终奖吗？

第一时间获取 Python 技术干货! 阅读文本大概需要 5 分钟. 01 目标场景:又到一年年底,大家辛辛苦苦给公司干了一整年,相信大家比较关心的是今年公司「年终奖」奖励方案. 和往年不一样, ...
如何利用“wordcloud+jieba”制作中文词云？

如何利用"wordcloud+jieba"制作中文词云? 词云又叫文字云,它可以统计文本中频率较高的词,并将这些词可视化,让我们可以直观的了解文本中的重点词汇(词的频率越高,词显示 ...
python入门基础，全网最详细教程

python入门基础，全网最详细教程
WordCloud词云库快速入门（一)

WordCloud简介 wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本. 安装 pip install wordcloud#安装绘制一个 ...
stylecloud:简洁易用的词云库

预祝全国考生:鲤鱼跃龙门,门门考高分~ stylecloud基于wordcloud库,使用方法更简单一些.该库的特点有支持词云图图标形状设置可直接读取csv文件(csv有两列,word和freq) ...
wordmesh: 聪明的英文词云库

词云图相当于数据分析第一步-描述性统计.它能让我们更方便的从文本中抽取关键词,更好的把握文本的整体信息. wordmesh使用spacy包里预装的语言模型来构建文本特征.基于图的算法来提取关键字.多维 ...
Py之Crawler：基于requests库+json库实现爬取刘若英2018导演电影《后来的我们》的插曲《再见》张震岳的几十万热评+词云：发现“再见”亦是再也不见

Py之Crawler:基于requests库+json库实现爬取刘若英2018导演电影<后来的我们>的插曲<再见>张震岳的几十万热评+词云:发现"再见"亦是 ...
Python Web实战：Flask + Vue 开发一个漂亮的词云网站

轻松编程社轻松编程社 Python里面两大最牛的Web框架,一个是Django,一个是Flask .今天就分享一个用Flask做的词云生成网站,非常有意思的小web,适合练手. 这是一个前端用 Vu ...
中国象棋云库

中国象棋云库是款在电脑端进行使用的象棋工具:它也就是大家经常说的pc端,让您可以轻松的查询到各种类型的历史走法,而且还可对象棋的规定进行查看,可以对先手进行设置,让您对残局的类型进行选择学习:不管是新 ...
免费学习象棋神器象棋云库

免费学习象棋神器象棋云库
这个残局，飞哥和云库软件PK，一胜一和！

这个残局，飞哥和云库软件PK，一胜一和！