Py之jieba：Python包之jieba包(中文分词最好的组件)简介、安装、使用方法之详细攻略

2024-05-03 13:39:59

Py之jieba：Python包之jieba包(中文分词最好的组件)简介、安装、使用方法之详细攻略

jieba简介

应该算得上是分词领域的佼佼者，想要使用python做文本分析，分词是必不可少的一个环节。
(1)支持三种分词模式：
　　(1)精确模式：试图将句子最精确的切开，适合文本分析。
　　(2)全模式：把句子中所有可以成词的词语都扫描出来，速度非常快，但是不能解决歧义。
　　(3)搜索引擎模式：在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。
(2)支持繁体分词
(3)支持自定义词典

jieba安装

pip install jieba

好啦，大功告成，开始使用吧！

jieba使用方法

1、进行分词

import jieba
text='周杰伦（Jay Chou），1979年1月18日出生于台湾省新北市，祖籍福建省泉州市永春县，中国台湾流行乐男歌手、原创音乐人、演员、导演等，毕业于淡江中学。'
text_cut = jieba.cut(text, cut_all=False)
print(list(text_cut))

['周杰伦', '（', 'Jay', ' ', 'Chou', '）', '，', '1979', '年', '1', '月', '18', '日出', '生于', '台湾省', '新北市', '，', '祖籍', '福建省', '泉州市', '永春县', '，', '中国台湾', '流行乐', '男歌手', '、', '原创', '音乐', '人', '、', '演员', '、', '导演', '等', '，', '毕业', '于', '淡江', '中学', '。']

赞 (0)

纯Python方案实现中英文全文搜索

优质文章,第一时间送达! 在互联网上的各类网站中,无论大小,基本上都会有一个搜索框,用来给用户对内容进行搜索,小到站点搜索,大到搜索引擎搜索. 从简单的来说,搜索功能确实很简单,一个简单的 selec ...
(2条消息) 基于python中jieba包的中文分词中详细使用（一）

文章目录基于python中jieba包的中文分词中详细使用(一) 01.前言 02.jieba的介绍 02.1 What 02.2特点 02.3安装与使用 02.4涉及到的算法 03.主要功能 03 ...
Python之 sklearn：sklearn中的RobustScaler 函数的简介及使用方法之详细攻略

Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 sklearn中的RobustScaler 函数的简介及使用方法 RobustScaler ...
Python之 sklearn：sklearn中的train_test_split函数的简介及使用方法之详细攻略

Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略sklearn中的train_test_split函数的简介官方文档:https://s ...
Python语言学习：Python常用自带库(imageio、pickle)简介、使用方法之详细攻略

Python语言学习:Python常用自带库(imageio.pickle)简介.使用方法之详细攻略 imageio简介及其常见使用方法 IMAIO是一个Python库,它提供了一个简单的接口来读取和 ...
Python语言学习之变量那些事：局部变量、全局变量的使用方法之详细攻略

Python语言学习之变量那些事:局部变量.全局变量的使用方法之详细攻略变量那些事 1.判断变量test,是否已经被定义 #判断变量test,是否已经被定义 res1 = 'test' in loc ...
Python：numpy库中的一些函数简介、使用方法之详细攻略

Python:numpy库中的一些函数简介.使用方法之详细攻略numpy库中的一些函数简介.使用方法1.np.concatenate()1.1.函数案例import numpy as npa=np.a ...
Py之matplotlib.pyplot：matplotlib.pyplot的plt.legend函数的简介、使用方法之详细攻略

Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介.使用方法之详细攻略matplotlib.pyplot的plt.legend函数的简介leg ...
Py之chatterbot：python包之Chatterbot包/wxpy包简介、安装、使用方法之详细攻略

Py之chatterbot:python包之Chatterbot包/wxpy包简介.安装.使用方法之详细攻略 Chatterbot包/wxpy包简介 ChatterBot是一个基于机器学习的聊天机器人 ...
Py之pyecharts：python包之数据可视化包pyecharts简介、安装、使用方法之详细攻略

Py之pyecharts:python包之数据可视化包pyecharts简介.安装.使用方法之详细攻略相关文章百度官网echarts案例 Py之pyecharts:python包之数据可视化包py ...
Py之qrcode：Python包之qrcode的简介、安装、使用方法之详细攻略

Py之qrcode:Python包之qrcode的简介.安装.使用方法之详细攻略 qrcode简介二维码简称 QR Code(Quick Response Code),学名为快速响应矩阵码,是二维条 ...