3.1 通用序列操作
在讲解列表和元组之前,本节先介绍Python中序列的通用操作,这些操作在列表和元组中都会用到。
Python中所有序列都可以进行一些特定操作,包括索引(indexing)、分片(slicing)、序列相加(adding)、乘法(multiplying)、成员资格、长度、最小值和最大值。
3.1.1 索引
序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字,代表它在序列中的位置(索引),第一个索引是0,第二个索引是1,以此类推。
序列中所有元素都是有编号的,从0开始递增。可以通过编号分别对序列的元素进行访问。下面通过交互输入的方式介绍一个通过编号取元素的例子。
>>> greeting='Hello'#定义变量greeting,并赋值Hello >>> greeting[0] #根据编号取元素,使用格式为:在中括号中输入所取元素的编号值 'H' >>> greeting[1] 'e' >>> greeting[2] 'l'
可以看到,序列中的元素从0开始,从左向右依自然顺序编号,元素可以通过编号访问。获取元素的方式为:在变量后加中括号,在中括号中输入所取元素的编号值。这个格式需要记住。
类似于我们平时排队,站成一排时,一般从左往右编号,编上序号后(一般从1开始编号,不会从0开始),当叫一个序号时,就会由序号对应到人。程序中的序列也是如此。
这里的编号就是索引,可以通过索引获取元素。所有序列都可以通过这种方式进行索引。
提 示
字符串是由字符组成的序列。索引0指向第一个元素。比如在上面的示例中,索引0指向字母H,索引1指向字母e,索引2指向字母l。
上面的示例是从左往右通过编号获取元素的,是否可以从右往左通过编号获取元素呢?我们试一试,在交互模式下输入:
>>> greeting[-1] 'o' >>> greeting[-2] 'l' >>> greeting[-3] 'l' >>> greeting[-4] 'e'
可以看到,Python的序列也可以从右开始索引,最右边的元素索引值为-1,从右向左递减。
在Python中,从左向右索引称为正数索引,从右向左索引称为负数索引。使用负数索引时,Python会从最后一个元素开始计数。最后一个元素的位置编号是-1。
提 示
最后一个元素的编号不是-0,跟数学中的概念一样:−0=0,−0和0都指向第一个元素。
从上面的几个示例可以看到,进行字符串的索引时都定义了一个变量,其实不定义变量也可以。下面来看一个例子,在交互模式下输入:
>>> 'Hello'[0] 'H' >>> 'Hello'[1] 'e' >>> 'Hello'[-1] 'o' >>> 'Hello'[-2] 'l'
可以看到,直接使用索引,不定义变量进行引用也可以。直接使用索引的效果和定义变量的效果是一样的。
如果函数返回一个序列,是否可以直接对结果进行索引操作呢?在交互模式下输入:
>>> thirdth=input()[0] happy >>> thirdth 'h'
由输出结果可以看到,直接对函数的返回结果进行了索引操作。
索引既可以对变量的引用操作,也可以直接操作序列,还可以操作函数的返回序列。
3.1.2 分片
索引用来对单个元素进行访问,使用分片可以对一定范围内的元素进行访问,分片通过冒号相隔的两个索引实现。在交互模式下输入:
>>> number=[1,2,3,4,5,6,7,8,9,10] >>> number[1:3] #取索引为第一和第二的元素 [2, 3] >>> number[-3:-1] #负数表明从右开始计数,取得倒数第三和倒数第二的元素 [8, 9]
由操作结果可以看到,分片操作既支持正数索引,也支持负数索引,并且对于提取序列的一部分很方便。
分片操作的实现需要提供两个索引作为边界,第一个索引的元素包含在分片内,第二个索引的元素不包含在分片内。像数学里的a≤x<b,x是我们需要得到的元素,a是分片操作中的第一个索引,b是第二个索引,b不包含在x的范围内。
对于上面的示例,假设需要访问最后3个元素,使用正数索引可以这样操作:
>>> number=[1,2,3,4,5,6,7,8,9,10] >>> number[7:10] #取最后3个元素 [8, 9, 10]
由以上输入和我们前面对序列的定义可以得出,number的编号最大应该为9,编号为10指向的是第11个元素,是一个不存在的元素,但是由于在最后一个元素之后,因此能得到最后一个元素。这么做没问题。如果需要从列表的结尾开始,即使用负数索引,怎么办呢?我们尝试看看,输入如下:
>>> number=[1,2,3,4,5,6,7,8,9,10] >>> number[-3:-1] [8, 9]
结果没有输出最后一个元素。再试试使用索引0作为最后一个元素的下一个元素,输入如下:
>>> number[-3:0] []
这个输出结果有点奇怪,竟然一个数值都没有。
事实上,只要在分片中最左边的索引比它右边的索引晚出现在序列中,结果就是一个空序列。比如上例中,-3代表倒数第3个元素,0代表第一个元素,倒数第3个元素比第一个元素晚出现,即排在第一个元素后面,所以得到的结果是空序列。
我们怎么通过负数索引的方式取得最后一个元素呢?这里有一个捷径可以使用。如果需要取得的分片包括序列结尾的元素,只需将第二个索引设置为空即可。输入如下:
>>> number[-3:] [8, 9, 10]
输出结果和我们预期的一样。
正数索引能否使用这种方式呢?输入如下:
>>> number[0:] #从第一个元素开始输出,输出全部结果 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] >>> number[:0] #最后一个元素为第一个,输出为空 [] >>> number[:3] #取得前3个元素 [1, 2, 3]
由输出结果可以知道也适用于正数索引。
根据上述输出结果可知,若需要输出整个序列,则可以将两个索引都设置为空。输入如下:
>>> number[:] #取得整个数组 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
输出结果是整个序列。
进行分片时,分片的开始点和结束点都需要指定(无论是直接指定还是间接指定),用这种方式取连续的元素没有问题,但若要取序列中不连续的元素就比较麻烦,或者直接不能操作。比如要取序列number中的所有奇数,以一个序列展示出来,用前面的方法就不能实现了。
对于上面这种情况,Python为我们提供了另一个参数——步长(step length),该参数通常是隐式设置的。在普通分片中,步长是1。分片操作就是按照这个步长逐个遍历序列的元素,遍历后返回开始点和结束点之间的所有元素。也可以理解为默认步长是1,即没有设置步长时,步长隐式设置值为1。输入如下:
>>> number[0:10:1] [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
由上面的示例可以看到,分片包含另一个数字。这种方式就是步长的显式设置。看起来和隐式设置步长没什么区别,得到的结果也和之前一样。但若将步长设置为比1大的数,结果会怎样呢?输入如下:
>>> number[0:10:2] [1, 3, 5, 7, 9]
由上面的输出结果可以看到,对于number序列,设置步长为2时,得到的结果就是我们前面想要的奇数序列。
由结果可知,步长设置为大于1的数时,会得到一个跳过某些元素的序列。例如,我们上面设置的步长为2,得到的序列是从开始到结束每隔1个元素的序列。比如还可以这样使用:
>>> number[0:10:3] [1, 4, 7, 10] >>> number[2:6:3] [3, 6] >>> number[2:5:3] [3] >>> number[1:5:3] [2, 5]
由以上输出结果可以看到,使用步长的方式还是很灵活的。
除了上面的使用方式外,设置前面两个索引为空的捷径也可以使用。操作如下:
>>> number[::3] [1, 4, 7, 10]
上面的操作将序列中每3个元素的第一个提取出来,前面两个索引都设置为空。步长设置为0是否可行呢?输入如下:
>>> number[::0] Traceback (most recent call last): File "<stdin>", line 1, in <module> ValueError: slice step cannot be zero
输出结果告诉我们步长不能为0。
步长是否可以为负数呢?输入如下:
>>> number[10:0:-2] [10, 8, 6, 4, 2] >>> number[0:10:-2] [] >>> number[::-2] [10, 8, 6, 4, 2] >>> number[5::-2] [6, 4, 2] >>> number[:5:-2] [10, 8] >>> number[::-1] [10, 9, 8, 7, 6, 5, 4, 3, 2, 1] >>> number[10:0:-1] #第二个索引为0,取不到序列中的第一个元素 [10, 9, 8, 7, 6, 5, 4, 3, 2] >>> number[10::-1] #设置第二个索引为空,可以取到序列的第一个元素 [10, 9, 8, 7, 6, 5, 4, 3, 2, 1] >>> number[2::-1] #设置第二个索引为空,可以取到序列的第一个元素 [3, 2, 1] >>> number[2:0:-1] #第二个索引为0,取不到序列中的第一个元素 [3, 2]
上面的输出结果好像不太好理解,使用负数步长时的结果怎么跟使用正数步长的结果相反呢?这就是正数步长和负数步长的不同。
对于正数步长,Python会从序列的头部开始向右提取元素,直到最后一个元素;对于负数步长,则是从序列的尾部开始向左提取元素,直到第一个元素。正数步长必须让开始点小于结束点,而负数步长必须让开始点大于结束点。
提 示
通过示例可以看到,使用负数步长时,设置第二个索引为空才能取到序列的第一个元素。
3.1.3 序列相加
使用加号可以进行序列的连接操作,输入如下:
>>> [1,2,3]+[4,5,6] [1, 2, 3, 4, 5, 6] >>> a=[1,2] >>> b=[5,6] >>> a+b [1, 2, 5, 6] >>> s='hello,' >>> w='world' >>> s+w 'hello,world'
由上面的输出结果可以看到,数字序列可以和数字序列通过加号连接,连接后的结果还是数字序列;字符串序列也可以通过加号连接,连接后的结果还是字符串序列。数字序列是否可以和字符串序列相加,结果是数字序列还是字符串序列呢?输入如下:
>>> [1,2]+'hello' Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: can only concatenate list (not "str") to list >>> type([1,2]) #取得[1,2]的类型为list <class 'list'> >>> type('hello') #取得hello的类型为字符串 <class 'str'>
由上面的输出结果可以看到,数字序列和字符串序列不能通过加号连接。错误提示的信息是:只能列表和列表相连。
由试验结果可以得知:只有类型相同的序列才能通过加号进行序列连接操作,不同类型的序列不能通过加号进行序列连接操作。
3.1.4 乘法
注意此处的乘法并不是数学中定义的乘法。
用一个数字x乘以一个序列会生成新的序列。在新的序列中,原来的序列将被重复x次,这就是序列中的乘法。在交互模式下输入:
>>> 'hello'*5 'hellohellohellohellohello' >>> [7]*10 [7, 7, 7, 7, 7, 7, 7, 7, 7, 7]
从输出结果看到,序列被重复了对应的次数,而不是做了数学中的乘法运算。
在Python中,序列的乘法有什么特殊之处呢?
如果要创建一个重复序列,就可以像上面的示例一样乘以一个想要得到的序列长度的数字,这样可以快速得到需要的列表,非常方便。
空列表可以简单通过两个中括号([])表示,表示里面什么东西都没有。如果想创建一个占用10个或更多元素的空间,却不包括任何有用内容的列表,该怎么办呢?我们可以像上面的示例一样乘以10或对应的数字,得到需要的空列表,也很方便。
如果要初始化一个长度为x的序列,就需要让每个编码位置上都是空值,此时需要一个值代表空值,即里面没有任何元素,可以使用None。None是Python的内建值,确切含义是“这里什么也没有”。例如,输入如下:
>>> sq=[None]*5 #初始化sq为含有5个None的序列 >>> sq [None, None, None, None, None]
从示例我们可以看到,Python中的序列乘法可以帮助我们快速做一些初始化操作。序列乘法做一些重复操作、空列表和None初始化操作还是挺方便的。
3.1.5 成员资格
为了检查一个值是否在序列中,Python为我们提供了in运算符。in运算符和前面讨论过的运算符有些不同。in运算符用于检验某个条件是否为真,并返回检验结果,检验结果为真返回True,为假返回False。这种运算符称作布尔运算符,返回的真值叫作布尔值。关于布尔运算符的更多内容会在后续章节中进行介绍。
下面我们尝试使用in在交互模式下输入:
>>> greeting='hello,world' >>> 'w' in greeting #检测w是否在字符串中 True >>> 'a' in greeting False >>> users=['xiaomeng','xiaozhi','xiaoxiao'] >>> 'xiaomeng' in users #检测字符串是否在字符串列表中 True >>> 'xiaohuai' in users False >>> numbers=[1,2,3,4,5] >>> 1 in numbers #检测数字是否在数字列表中 True >>> 6 in numbers False >>> eng='** Study python is so happy!**' >>> '**' in eng #检测一些特殊字符是否在字符串中 True >>> '$' in eng False >>> 'a' in numbers False >>> 3 in greeting Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: 'in <string>' requires string as left operand, not int
由上面的输出结果可以看到,使用in可以很好地检测字符或数字是否在对应的列表中。并且可以看出,数字类型不能在字符串类型中通过in进行成员资格检测,而字符串类型可以在数字列表中通过in进行成员资格检测。
3.1.6 长度、最小值和最大值
Python为我们提供了长度、最大值和最小值的内建函数,对应的内建函数分别为len、max和min。
这3个函数该怎么使用呢?在交互模式下输入:
>>> numbers=[300,200,100,800,500] >>> len(numbers) 5 >>> max(numbers) 800 >>> min(numbers) 100 >>> max(5,3,10,7) 10 >>> min(7,0,3,-1) -1
由上面的结果可以看到,len函数返回序列中所包含元素的数量,max函数和min函数分别返回序列中最大和最小的元素。在该示例中,前面几个函数的输入参数都是序列,可以使用前面的解释理解。max函数和min函数的参数不是一个序列,而是以多个数字直接作为参数,此处直接求取多个数字的最大值和最小值。