第12天:Python 集合

Python也包含有 集合 类型。集合是由不重复元素组成的无序的集。它的基本用法包括成员检测和消除重复元素。集合对象也支持像 联合,交集,差集,对称差分等数学运算。

集合结构如下:

set1 = {'hello', 'hello', 'word', 'word'}set1# 输出结果实现自动去重{'hello', 'word'}

1、集合创建

可以使用大括号 { } 或者 set() 函数创建集合,

创建格式:

parame = {value01,value02,...}或者set(value)

==注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。==

# 创建空集合>>> empty_set = set()>>> type(empty_set) <class 'set'>

# 创建空字典>>> empty_dict = {}>>> type(empty_dict) <class 'dict'>

2、集合的基本操作

2.1 添加元素

语法格式:

s.add(x)

将元素 x 添加到集合 s 中,如果元素已存在,则不进行任何操作。

s = set(('hello','world'))print(s)
# 向集合 s 中添加元素s.add('!')print('添加元素后的集合是:%s' % s)
# 输出结果是:添加元素后的集合是:{'world', '!', 'hello'}

除了 add() 方法可以添加元素外,还有一个方法,也可以添加元素,并且参数可以是列表,元组,字典等,语法格式如下:

s.update( x )

参数 x 可以是一个,也可以是多个,多个参数之间用逗号相隔

# 1)添加列表s.update([1,3],[2,4])print('添加元素后的集合是:%s' % s)
# 2)添加元组s.update(('h', 'j'))print('添加元素后的集合是:%s' % s)

2.2 移除元素

语法格式:

s.remove( x )

将元素 x 从集合 s 中移除,如果元素不存在,则会发生错误。

# 将元素 2 从集合中移除s.remove(2)print('移除元素 2 后的集合是:%s' % s)
# 如果移除集合中不存在的元素会报异常# 移除集合中不存在的集合s.remove('hi')print('移除元素后的集合是:%s' % s)
# 异常信息Traceback (most recent call last): File "test.py", line 20, in <module> s.remove('hi') KeyError: 'hi'

此外还有一个方法也是移除集合中的元素,且如果元素不存在,不会发生错误。格式如下所示:

s.discard( x )
>>>thisset = set(("Google", "Runoob", "Taobao"))>>> thisset.discard("Facebook") # 不存在不会发生错误>>> print(thisset){'Taobao', 'Google', 'Runoob'}

我们也可以设置随机删除集合中的一个元素,语法格式如下:

s.pop()
# 随机删除集合中的一个元素print(s)
s.pop()
print('移除元素后的集合是:%s' % s)
输出结果:{1, 3, 4, 'world', '!', 'hello', 'h', 'j'}移除元素后的集合是:{3, 4, 'world', '!', 'hello', 'h', 'j'}

注意:在交互模式,pop 是删除集合的第一个元素(排序后的集合的第一个元素)。

2.3 计算集合元素个数

语法格式:

len(s)

计算集合 s 元素个数。

print('集合 s 的长度是:%s' % len(s))
# 输出结果集合 s 的长度是:7

2.4 清空集合

语法格式:

s.clear()

清空集合 s

s.clear()print('集合清空后的结果是:%s' % s)
# 输出结果:集合清空后的结果是:set()

2.5 判断元素是否存在

语法格式:

x in s

判断元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。

# 判断元素是否存在s = {'hello', 'word'}# 判断元素 hello 是否在集合 s 中
print(hello' in s)
# 输出结果:True

2.6 集合运算

集合之间的运算符分别是'-’、'|’、'&’、'^’ ; 下面以两个集合之间的运算为例进行讲解:

  • '-’:代表前者中包含后者中不包含的元素

  • '|’:代表两者中全部元素聚在一起去重后的结果

  • '&’:两者中都包含的元素

  • '^’:不同时包含于两个集合中的元素

>>> a = set('afqwbracadaagfgbrafg')>>> b = set('rfgfgfalacazamddg')>>> a {'r', 'q', 'd', 'b', 'w', 'g', 'f', 'c', 'a'}>>> b{'r', 'd', 'g', 'f', 'l', 'z', 'c', 'm', 'a'}# 集合a中包含而集合b中不包含的元素>>> a - b {'b', 'w', 'q'} # 集合a或b中包含的所有元素>>> a | b {'d', 'g', 'l', 'c', 'r', 'q', 'b', 'w', 'f', 'z', 'm', 'a'}# 集合a和b中都包含了的元素>>> a & b {'r', 'd', 'g', 'f', 'c', 'a'}# 不同时包含于a和b的元素>>> a ^ b {'l', 'q', 'b', 'w', 'z', 'm'}

3、集合推导式

和列表一样,集合也支持推导式

# 判断元素是否存在>>> a = {x for x in 'abracadabra' if x not in 'abc'}>>> a{'r', 'd'}

4、集合内置方法

4.1 difference()

difference() 方法用于返回集合的差集,即返回的集合元素包含在第一个集合中,但不包含在第二个集合(方法的参数)中,返回一个新的集合。** difference() 方法语法:**

set.difference(set)

实例: 两个集合的差集返回一个集合,元素包含在集合 x ,但不在集合 y :

# 求两个集合的差集,元素在 x 中不在 y 中x = {"apple", "banana", "cherry"}y = {"google", "microsoft", "apple"}
z = x.difference(y)
print('两个集合的差集是:%s' % z)
# 输出结果为:{'cherry', 'banana'}

4.2 difference_update()

  • difference_update() 方法用于移除两个集合中都存在的元素。

  • difference_update() 方法与 difference() 方法的区别在于 difference() 方法返回一个移除相同元素的新集合,而 difference_update() 方法是直接在原来的集合中移除元素,没有返回值。

x = {"apple", "banana", "cherry"}y = {"google", "microsoft", "apple"}
x.difference_update(y)
print(x)结果为:{'banana', 'cherry'}

x1 = {1,2,3,4}y1 = {1,2,3}
x1.difference_update(y1)
print(x1)
# 结果为:{4}

4.3 intersection()

intersection() 方法用于返回两个或更多集合中都包含的元素,即交集,返回一个新的集合。

intersection() 方法语法:

set.intersection(set1, set2 ... etc)
**参数:**set1 -- 必需,要查找相同元素的集合set2 -- 可选,其他要查找相同元素的集合,可以多个,多个使用逗号 , 隔开

实例:

# 返回两个或者多个集合的交集x = {"apple", "banana", "cherry"}y = {"google", "runoob", "apple"}
z = x.intersection(y)
print(z)
# 返回三个集合的交集x = {"a", "b", "c"}y = {"c", "d", "e"}z = {"f", "g", "c"}
result = x.intersection(y, z)print('三个集合的差集是:%s' % result)
# 输出结果:
{'apple'}两个集合的差集是:{'c'}

4.4 intersection_update()

  • intersection_update() 方法用于获取两个或更多集合中都重叠的元素,即计算交集。

  • intersection_update() 方法不同于 intersection() 方法,因为 intersection() 方法是返回一个新的集合,而 intersection_update() 方法是在原始的集合上移除不重叠的元素。

intersection_update() 方法语法:

set.intersection_update(set1, set2 ... etc)
**参数**set1 -- 必需,要查找相同元素的集合set2 -- 可选,其他要查找相同元素的集合,可以使用多个多个,多个使用逗号',’ 隔开

实例:

# 返回一个无返回值的集合交集x = {"apple", "banana", "cherry"}y = {"google", "runoob", "apple"}
x.intersection_update(y)
print(x)
x = {"a", "b", "c"}y = {"c", "d", "e"}z = {"f", "g", "c"}
x.intersection_update(y, z)
print(x)
# 输出结果:{'apple'}{'c'}

4.5 union()

union() 方法返回两个集合的并集,即包含了所有集合的元素,重复的元素只会出现一次,返回值返回一个新的集合

语法:

union() 方法语法:
set.union(set1, set2...)参数set1 -- 必需,合并的目标集合set2 -- 可选,其他要合并的集合,可以多个,多个使用逗号 , 隔开。

实例:

# 合并两个集合,重复元素只会出现一次:
x = {"apple", "banana", "cherry"}y = {"google", "runoob", "apple"} z = x.union(y) print(z)输出结果为:
{'cherry', 'runoob', 'google', 'banana', 'apple'}

# 合并多个集合:
实例 1x = {"a", "b", "c"}y = {"f", "d", "a"}z = {"c", "d", "e"} result = x.union(y, z) print(result)输出结果为:
{'c', 'd', 'f', 'e', 'b', 'a'}

4.6 isdisjoint()

isdisjoint() 方法用于判断两个集合是否包含相同的元素,==如果没有返回 True,否则返回 False。==

语法:

isdisjoint() 方法语法:
set.isdisjoint(set)

实例:

x = {"apple", "banana", "cherry"}y = {"google", "runoob", "apple"}# 判断集合 y 中是否包含集合 x 中的元素,如果没有返回 True, 有则返回 Falsez = x.isdisjoint(y)# 结果返回 False,说明集合 y 中有和 x 中相同的元素print(z)

x = {"apple", "banana", "cherry"}y = {"google", "runoob", "baidu"}# 判断集合 y 中是否包含集合 x 中的元素,如果没有返回 True, 有则返回 Falsez = x.isdisjoint(y)# 结果返回 True,说明集合 y 中没有和 x 中相同的元素print(z)

输出结果:FalseTrue

4.7 issubset()

issubset() 方法用于判断集合的所有元素是否都包含在指定集合中,如果是则返回 True,否则返回 False。

语法:

issubset() 方法语法:
set.issubset(set)
**参数**set -- 必需,要比查找的集合返回值返回布尔值,如果都包含返回 True,否则返回 False。

实例:

# 判断集合 x 的所有元素是否都包含在集合 y 中:x = {"a", "b", "c"}y = {"f", "e", "d", "c", "b", "a"} z = x.issubset(y) print(z)
输出结果# 说明 集合 x 中的元素都包含在 y 中True

注意:必须是集合中的元素都包含在内,否则结果为false

# 集合 y 中只有元素 b 和 c ,执行结果为False x = {"a", "b", "c"}y = {"f", "e", "d", "c", "b","y"}
z = x.issubset(y)
print(z)
结果输出;False

4.8  issuperset()

issuperset() 方法用于判断指定集合的所有元素是否都包含在原始的集合中,如果是则返回 True,否则返回 False。

语法:

set.issuperset(set)

实例:

# 判断集合 y 的所有元素是否都包含在集合 x 中:x = {"f", "e", "d", "c", "b", "a"}y = {"a", "b", "c"} z = x.issuperset(y) print(z)输出结果为:
True

# 如果没有全部包含返回 False:
实例 1x = {"f", "e", "d", "c", "b"}y = {"a", "b", "c"} z = x.issuperset(y) print(z)输出结果为:
False

4.9 symmetric_difference()

symmetric_difference() 方法返回两个集合中不重复的元素集合,即会移除两个集合中都存在的元素,结果返回一个新的集合。

语法:

set.symmetric_difference(set)

实例:

# 返回两个集合组成的新集合,但会移除两个集合的重复元素:x = {"apple", "banana", "cherry"}y = {"google", "runoob", "apple"}
z = x.symmetric_difference(y)
print(z)
输出结果:{'banana', 'google', 'cherry', 'runoob'}

4.10 symmetric_difference_update()

symmetric_difference_update() 方法移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。

语法:

set.symmetric_difference_update(set)

实例:

# 在原始集合 x 中移除与 y 集合中的重复元素,并将不重复的元素插入到集合 x 中:x = {"apple", "banana", "cherry"}y = {"google", "runoob", "apple"}
x.symmetric_difference_update(y)
print(x)
输出结果:{'runoob', 'cherry', 'banana', 'google'}

后记:其他几个方法是对集合的增删改查,如:add() clear() copy() update() pop() remove() discard() 等方法,这些方法在对集合的基本操作章节有详解,大家到时候按需使用。

总结

本节给大家介绍了 Python 数据结构之集合的操作与使用,对 Python 工程师使用集合的一些基本知识与实践操作提供了支撑。

参考:

http://www.pythondoc.com/pythontutorial3 https://www.runoob.com/python3/python3-set.html

系列文章

第10天:Python类与对象

(0)

相关推荐

  • python基本数据结构

    文章目录 列表list 访问列表中的值 更新列表 删除列表元素 列表脚本操作符 列表截取与拼接 嵌套列表 直接赋值 浅拷贝 深拷贝 列表函数&方法 列表函数 **sorted(iterable ...

  • 面试题-python3 里面的集合(set)到底是有序还是无序的?

    前言 集合,简称集,是数学中一个基本概念,主要有以下两个特征: 一个集合中,任何两个元素都认为是不相同的,即每个元素只能出现一次 一个集合中,每个元素的地位都是相同的,元素之间是无序的. 集合(set ...

  • R语言学习笔记

    R语言学习笔记

  • Python求列表的差集、交集与并集?

    公众号新增加了一个栏目,就是每天给大家解答一道Python常见的面试题,反正每天不贪多,一天一题,正好合适,只希望这个面试栏目,给那些正在准备面试的同学,提供一点点帮助! 小猿会从最基础的面试题开始, ...

  • python中的内置函数

    前言 本人只在csdn写博客 内置函数 介绍 一. 数学运算 abs()求绝对值函数 round() 近似取值 pow()求指数 divmod()求商和余数 max()求最大值和min()求最小值 s ...

  • Python集合浅谈

    2 集合相关操作 Python 对集合也提供了并集.交集.差集等运算.我们给出示例: >>> a = {1,3,'sxt'} >>> b = {'he','it', ...

  • python集合

    长征五号飞上天了...... (图片来源于网络) 集合(set)同样是python中的一种数据类型. 集合与列表.元组的区别在于,它是一种无序的不重复的元素的序列. 无序的意思是,它里面的数据元素是没 ...

  • 12个python数据处理常用内置函数

    简说Python 以下文章来源于python数据分析之禅 ,作者小dull鸟  简说Python推荐  来源|python数据分析之禅 作者|小dull鸟 在python数据分析中,经常需要对字符串进 ...

  • 盘点12个Python数据可视化库,通吃任何领域

    大家普遍第一次接触到的Python数据可视化库基本上都是Matplotlib.Python还有很多数据可视化库,本文盘点了12款常用的Python数据可视化库,挑选适合自己业务的那一款吧! 深入学习P ...

  • 玩转Python集合,这一篇就够了!

    选自DataCamp, 作者:Michael Galarnyk 本文由机器之心编译 了解 Python 集合: 它们是什么,如何创建它们,何时使用它们,什么是内置函数,以及它们与集合论操作的关系 集合 ...

  • 【Python基础】一文理解Python集合,17个方法全解,看完就够了

    一.集合的定义 01 定义与特性 Python中的集合类似于数学中的集合概念,它是一组无序.不可重复元素序列,集合用{value1,value2}创建,某种程度上可以把集合看作是没有值的字典.字典是d ...

  • 12种Python 机器学习 & 数据挖掘 工具包(附链接)

    作为一种解释型语言,Python的设计哲学强调代码的可读性和简洁的语法(尤其是使用空格缩进划分代码块,而非使用大括号或者关键词).相比于C++或Java,Python让开发者能够用更少的代码表达想法. ...

  • 【视频课】12小时不一样的高质量Python基础课,推荐给你学习!

    在人工智能和深度学习领域,Python语言是必须掌握的,几乎所有的开源框架都基于Python接口,数据获取与整理需要用到Python,市面上Python教程众多,但良莠不齐,本次我们联合<王的机 ...

  • 【中考2020】专题突破(12) 一道翻折、垂直处理、隐圆大集合的好题

    写在前面 距离中考的时间不到10天了,初三的同学们已经进入最后冲刺阶段,为了帮助广大初三考生能在未来的中考中取得好成绩,笔者开设了<中考2020>专题突破的系列专栏,结合自身收集的好题与优 ...