int,整数类型(整形)
float,浮点类型(浮点型)
complex,复数类型
bool,布尔类型
str,字符串类型
高级数据类型:
list,列表类型
tuple,元组类型
dict,字典类型
set,集合类型
学习目标:
掌握列表的各种操作
本节问题:
问题1:列表的定义是什么?有哪些特点?
问题2:列表支持哪些方法和运算?
问题3:列表如何对元素进行增删改查?列出具体的方法或者基于的运算。
问题4:如何对列表元素进行遍历?
问题5:列表生成式和生成器的语法是什么?简单说一下它们的区别。
不知道大家是否注意到,字符串类型(str
)和之前讲到的数值类型(int
和float
)有一些区别。
数值类型是标量类型,也就是说这种类型的对象没有可以访问的内部结构;而字符串类型是一种结构化的、非标量类型,所以才会有一系列的属性和方法。
接下来我们要介绍的列表(list
),也是一种结构化的、非标量类型,它是值的有序序列,每个值都可以通过索引进行标识,定义列表可以将列表的元素放在[]
中,多个元素用,
进行分隔,可以使用for
循环对列表元素进行遍历,也可以使用[]
或[:]
运算符取出列表中的一个或多个元素。
一、案例引入
在开始本节课的内容之前,我们先给大家一个编程任务,将一颗色子掷6000次,统计每个点数出现的次数。这个任务对大家来说应该是非常简单的,我们可以用1到6均匀分布的随机数来模拟掷色子,然后用6个变量分别记录每个点数出现的次数,相信大家都能写出下面的代码。
1 | import random |
看看上面的代码,相信大家一定觉得它非常的“笨重”和“丑陋”,更可怕的是,如果要统计掷2颗或者更多的色子统计每个点数出现的次数,那就需要定义更多的变量,写更多的分支结构。讲到这里,相信大家一定想问:有没有办法用一个变量来保存多个数据,有没有办法用统一的代码对多个数据进行操作?答案是肯定的,在Python中我们可以通过容器类型的变量来保存和操作多个数据,我们首先为大家介绍列表(list)这种新的数据类型。
二、列表的定义
在Python中,列表是由一系元素按特定顺序构成的数据序列,这样就意味着定义一个列表类型的变量,可以保存多个数据,而且允许有重复的数据。跟我们讲到的字符串类型一样,列表也是一种结构化的、非标量类型。
在Python中,可以使用[]
字面量语法来定义列表,列表中的多个元素用逗号进行分隔,代码如下所示。
1 | items0 = [] # 空列表 |
除此以外,还可以通过Python内置的list
函数将其他序列变成列表。准确的说,list
并不是一个函数,而是创建列表对象的构造器(后面会讲到对象和构造器这两个概念)。
1 | items0 = list() # 空列表 |
需要说明的是,列表是一种可变数据类型,也就是说列表可以添加元素、删除元素、更新元素,这一点跟我们上一课讲到的字符串有着鲜明的差别。字符串是一种不可变数据类型,也就是说对字符串做拼接、重复、转换大小写、修剪空格等操作的时候会产生新的字符串,原来的字符串并没有发生任何改变。因此,列表的定义可以总结成这样一句话:列表是一个有序且可变的容器,在里面可以存放多个不同类型、数据元素可重复的元素。
- 特点
- 数据元素的类型可以不相同
- 以
[]
包裹,,
为分隔符 - 内部元素有序
- 内部元素可变
- 内部元素可重复
三、列表的方法
Python中为所有的列表类型的数据提供了一批内置方法。
在开始学习列表的内置方法之前,先来做一个字符串和列表的对比:
字符串,不可变,即:创建好之后内部就无法修改。【独有功能都是新创建一份数据】
1
2
3
4name = "Michael"
data = name.upper()
print(name)
print(data)列表,可变,即:创建好之后内部元素可以修改。【独有功能基本上都是直接操作列表内部,不会创建新的一份数据】
1
2
3
4user_list = ["车子","房子"]
user_list.append("票子")
print(user_list) # ["车子","房子","票子"]
列表中的常见内置方法如下:
- 追加元素
- append():在原列表中尾部追加值。
- extend(iterable):批量追加, 将一个列表中的元素逐一添加另外一个列表
- insert(index, object):在原列表的指定索引位置插入值
- 修改元素
- list[index] = value:修改指定索引位置的元素的值为value
- 删除元素
- remove(value):在原列表中根据值删除(从左到右找到第一个删除)【慎用,里面没有会报错】
- pop(index):在原列表中根据索引踢出某个元素(根据索引位置删除),返回该元素的值
- del list[index]:根据索引删除某个元素
- 清空表
- clear():清空原列表
- 查询
- index(value):根据值获取索引 找不到会报错
- count(value):根据值获取出现频次
- 排序
- sort(reverse=False):排序
- reverse():反转列表
1. 添加、删除、修改和清空列表
1 | items = ['Python', 'Java', 'Go', 'Kotlin'] |
需要提醒大家,在使用remove
方法删除元素时,如果要删除的元素并不在列表中,会引发ValueError
异常,错误消息是:list.remove(x): x not in list
。在使用pop
方法删除元素时,如果索引的值超出了范围,会引发IndexError
异常,错误消息是:pop index out of range
。
从列表中删除元素其实还有一种方式,就是使用Python中的del
关键字后面跟要删除的元素,这种做法跟使用pop
方法指定索引删除元素没有实质性的区别,但后者会返回删除的元素,前者在性能上略优(del
对应字节码指令是DELETE_SUBSCR
,而pop
对应的字节码指令是CALL_METHOD
和POP_TOP
)。
1 | items = ['Python', 'Java', 'Go', 'Kotlin'] |
2.查找元素位置和次数
列表类型的index
方法可以查找某个元素在列表中的索引位置;因为列表中允许有重复的元素,所以列表类型提供了count
方法来统计一个元素在列表中出现的次数。请看下面的代码。
1 | items = ['Python', 'Java', 'Java', 'Go', 'Kotlin', 'Python'] |
再来看看下面这段代码。
1 | items = ['Python', 'Java', 'Java', 'Go', 'Kotlin', 'Python'] |
3.元素排序和反转
列表的sort
操作可以实现列表元素的排序,而reverse
操作可以实现元素的反转,代码如下所示。
1 | items = ['Python', 'Java', 'Go', 'Kotlin', 'Python'] |
四、列表的运算
和字符串类型一样,列表也支持拼接、重复、成员运算、索引和切片以及比较运算,这里将列表常见的运算总结如下,请大家参考。
[] + []
, 相加,两个列表相加生成新列表[] * int
,相乘,列表*整型 将列表中的元素再创建N份并生成一个新的列表in/not in
,成员运算,判断元素是否在列表中len
, 获取列表的长度[index]
,索引[start:end:step]
,切片比较运算
:比的是对应索引位置上的元素的大小
使用示例
1 | items1 = [35, 12, 99, 68, 55, 87] |
要注意的是,由于列表是可变类型,所以通过索引操作既可以获取列表中的元素,也可以更新列表中的元素。对列表做索引操作一样要注意索引越界的问题,对于有N
个元素的列表,正向索引的范围是0
到N-1
,负向索引的范围是-1
到-N
,如果超出这个范围,将引发IndexError
异常,错误信息为:list index out of range
。
五、列表元素的遍历
如果想逐个取出列表中的元素,可以使用for
循环的,有以下两种做法。
方法一:
1 | items = ['Python', 'Java', 'Go', 'Kotlin'] |
方法二:
1 | items = ['Python', 'Java', 'Go', 'Kotlin'] |
讲到这里,我们可以用列表的知识来重构上面“掷色子统计每个点数出现次数”的代码。
1 | import random |
上面的代码中,我们用counters
列表中的六个元素分别表示1到6的点数出现的次数,最开始的时候六个元素的值都是0
。接下来用随机数模拟掷色子,如果摇出1点counters[0]
的值加1
,如果摇出2点counters[1]
的值加1
,以此类推。大家感受一下,这段代码是不是比之前的代码要简单优雅很多。
切记,循环的过程中对数据进行删除会踩坑
错误方式:有坑
1
2
3
4
5
6
7# 错误方式, 有坑,结果不是你想要的。
user_list = ["刘德发", "范德彪", "刘华强", '刘尼古拉斯赵四', "宋小宝", "刘能"]
for item in user_list:
if item.startswith("刘"):
user_list.remove(item)
print(user_list)正确方式:倒着删除
1
2
3
4
5
6user_list = ["刘得发", "范德彪", "刘华强", '刘尼古拉斯赵四', "宋小宝", "刘能"]
for index in range(len(user_list) - 1, -1, -1):
item = user_list[index]
if item.startswith("刘"):
user_list.remove(item)
print(user_list)
六、列表类型转换
其他数据类型转化为列表。只需要在外面包裹一层list即可。int、bool无法转换成列表
1 | list(其他类型数据) # 其他数据类型可以是str/tuple/dict/set等 |
示例:
1 | # int、bool无法转换成列表 |
七、嵌套列表
Python语言没有限定列表中的元素必须是相同的数据类型,也就是说一个列表中的元素可以任意的数据类型,当然也包括列表。如果列表中的元素又是列表,那么我们可以称之为嵌套的列表。嵌套的列表可以用来表示表格或数学上的矩阵,例如:我们想保存5个学生3门课程的成绩,可以定义一个保存5个元素的列表保存5个学生的信息,而每个列表元素又是3个元素构成的列表,分别代表3门课程的成绩。但是,一定要注意下面的代码是有问题的。
1 | scores = [[0] * 3] * 5 |
看上去我们好像创建了一个5 * 3
的嵌套列表,但实际上当我们录入第一个学生的第一门成绩后,你就会发现问题来了,我们看看下面代码的输出。
1 | # 嵌套的列表需要多次索引操作才能获取元素 |
我们不去过多的解释为什么会出现这样的问题,如果想深入研究这个问题,可以通过Python Tutor网站的可视化代码执行功能,看看创建列表时计算机内存中发生了怎样的变化,下面的图就是在这个网站上生成的。建议大家不去纠结这个问题,现阶段只需要记住不能用[[0] * 3] * 5]
这种方式来创建嵌套列表就行了。那么创建嵌套列表的正确做法是什么呢,下面的代码会给你答案。
1 | scores = [[0for _ in range(5)] |
对于嵌套的值,可以根据之前学习的索引知识点来进行学习,例如:
1 | data = [ "谢广坤",["海燕","赵本山"],True,[11,22,33,44],"宋小宝" ] |
八、列表生成式
在Python中,列表还可以通过一种特殊的字面量语法来创建,这种语法叫做生成式。它的语法是:
1 | [exp for iter_var in iterable] |
- 工作过程
- 迭代iterable中的每个元素;
- 每次迭代都先把结果赋值给iter_var,然后通过exp得到一个新的计算值;
- 最后把所有通过exp得到的计算值以一个新列表的形式返回。
我们给出两段代码,大家可以做一个对比,看看哪一种方式更加简单优雅。
通过for
循环为空列表添加元素。
1 | # 创建一个由1到9的数字构成的列表 |
通过生成式创建列表。
1 | # 创建一个由1到9的数字构成的列表 |
下面这种方式不仅代码简单优雅,而且性能也优于上面使用for
循环和append
方法向空列表中追加元素的方式。可以简单跟大家交待下为什么生成式拥有更好的性能,那是因为Python解释器的字节码指令中有专门针对生成式的指令(LIST_APPEND
指令);而for
循环是通过方法调用(LOAD_METHOD
和CALL_METHOD
指令)的方式为列表添加元素,方法调用本身就是一个相对耗时的操作。对这一点不理解也没有关系,记住“强烈建议用生成式语法来创建列表”这个结论就可以了。
- 带过滤功能的列表生成式
1 | [exp for iter_var in iterable [if exp]] |
1 | lists = [i for i in range(10) if i < 6] |
- 循环嵌套语法格式
1 | [exp for iter_var_A in iterable_A for iter_var_B in iterable_B] |
1 | L1 = ['香蕉', '苹果', '橙子'] |
- 用列表生成式生成一副牌【大小王除外】
九、列表生成器
1 | (exp for iter_var in iterable) |
1 | In [18]: lists = (i for i in range(10)) |
十、生成式和生成器的区别
先看一段代码
1 | f = [x for x in range(1, 10)] |
二者区别如下:
- 列表生成式: 会将所有的结果全部计算出来,把结果存放到内存中,如果列表中数据比较多,会占用过多的内存空间,可能导致MemoryError内存错误或者导致程序在运行时出现卡顿的情况。
- 列表生成器:会创建一个列表生成器对象,不会一次性的把所有结果都计算出来,如果需要序号获取数据,可以使用next()函数来获取,但要注意,一旦next()函数获取不到数据,会导致出现StopIteration异常错误,可以使用 for循环遍历生成器对象,获取所有数据。
- 列表生成式可以循环多次,列表生成器只可循环一次。
- 视情况而定,如果数据量比较大,推荐使用生成器;
十一、简单总结
Python中的列表底层是一个可以动态扩容的数组,列表元素在内存中也是连续存储的,所以可以实现随机访问(通过一个有效的索引获取到对应的元素且操作时间与列表元素个数无关)。我们暂时不去触碰这些底层存储细节以及列表每个方法的渐近时间复杂度(执行这个方法耗费的时间跟列表元素个数的关系),等需要的时候再告诉大家。现阶段,大家只需要知道列表是容器,可以保存各种类型的数据,如何对列表数据进行增删改查就可以了。