Python 迭代器
Python 迭代器
迭代器是可以迭代的对象。在本教程中,您将了解迭代器的工作原理以及如何使用 __iter__ 和 __next__ 方法构建自己的迭代器。
视频:Python 迭代器
Python 中的迭代器
迭代器在 Python 中无处不在。它们在 for
中优雅地实现 循环、推导式、生成器等,但隐藏在显而易见的地方。
Python 中的迭代器只是一个可以迭代的对象。一个将返回数据的对象,一次一个元素。
从技术上讲,Python 迭代器对象 必须实现两个特殊方法,__iter__()
和 __next__()
,统称为迭代器协议 .
一个对象被称为 iterable 如果我们能从中得到一个迭代器。 Python 中的大多数内置容器,如:list、tuple、string 等都是可迭代的。
iter()
函数(依次调用 __iter__()
方法)从它们返回一个迭代器。
通过迭代器进行迭代
我们使用 next()
函数手动遍历迭代器的所有项目。当我们到达终点并且没有更多数据要返回时,它将引发 StopIteration
例外。下面是一个例子。
# define a list
my_list = [4, 7, 0, 3]
# get an iterator using iter()
my_iter = iter(my_list)
# iterate through it using next()
# Output: 4
print(next(my_iter))
# Output: 7
print(next(my_iter))
# next(obj) is same as obj.__next__()
# Output: 0
print(my_iter.__next__())
# Output: 3
print(my_iter.__next__())
# This will raise error, no items left
next(my_iter)
输出
4 7 0 3 Traceback (most recent call last): File "<string>", line 24, in <module> next(my_iter) StopIteration
一种更优雅的自动迭代方式是使用 for 循环。使用它,我们可以迭代任何可以返回迭代器的对象,例如列表、字符串、文件等。
>>> for element in my_list:
... print(element)
...
4
7
0
3
迭代器 for 循环的工作
正如我们在上面的例子中看到的,for
循环能够自动遍历列表。
事实上 for
循环可以遍历任何可迭代对象。让我们仔细看看 for
是如何实现的 循环实际上是用 Python 实现的。
for element in iterable:
# do something with element
实际实现为。
# create an iterator object from that iterable
iter_obj = iter(iterable)
# infinite loop
while True:
try:
# get the next item
element = next(iter_obj)
# do something with element
except StopIteration:
# if StopIteration is raised, break from loop
break
所以在内部,for
循环创建一个迭代器对象,iter_obj
通过调用 iter()
在可迭代对象上。
具有讽刺意味的是,这个 for
循环实际上是一个无限的while循环。
在循环内部,它调用 next()
获取下一个元素并执行 for
的主体 用这个值循环。在所有项目耗尽后,StopIteration
被提升,内部被捕获并且循环结束。请注意,任何其他类型的异常都会通过。
构建自定义迭代器
在 Python 中从头开始构建迭代器很容易。我们只需要实现 __iter__()
和 __next__()
方法。
__iter__()
方法返回迭代器对象本身。如果需要,可以进行一些初始化。
__next__()
方法必须返回序列中的下一项。在到达终点时,以及在随后的调用中,它必须引发 StopIteration
.
在这里,我们展示了一个示例,该示例将在每次迭代中为我们提供 2 的下一个幂。幂指数从零开始直到用户设置的数字。
如果您对面向对象编程一无所知,请访问 Python 面向对象编程。
class PowTwo:
"""Class to implement an iterator
of powers of two"""
def __init__(self, max=0):
self.max = max
def __iter__(self):
self.n = 0
return self
def __next__(self):
if self.n <= self.max:
result = 2 ** self.n
self.n += 1
return result
else:
raise StopIteration
# create an object
numbers = PowTwo(3)
# create an iterable from the object
i = iter(numbers)
# Using next to get to the next iterator element
print(next(i))
print(next(i))
print(next(i))
print(next(i))
print(next(i))
输出
1 2 4 8 Traceback (most recent call last): File "/home/bsoyuj/Desktop/Untitled-1.py", line 32, in <module> print(next(i)) File "<string>", line 18, in __next__ raise StopIteration StopIteration
我们也可以使用 for
循环遍历我们的迭代器类。
>>> for i in PowTwo(5):
... print(i)
...
1
2
4
8
16
32
Python 无限迭代器
迭代器对象中的项目不必耗尽。可以有无限的迭代器(永远不会结束)。在处理此类迭代器时我们必须小心。
这是一个演示无限迭代器的简单示例。
内置函数 iter()
可以用两个参数调用,其中第一个参数必须是可调用对象(函数),第二个是哨兵。迭代器调用这个函数,直到返回值等于哨兵。
>>> int()
0
>>> inf = iter(int,1)
>>> next(inf)
0
>>> next(inf)
0
我们可以看到 int()
函数总是返回 0。所以将它作为 iter(int,1)
传递 将返回一个调用 int()
的迭代器 直到返回值等于 1。这永远不会发生,我们得到一个无限迭代器。
我们还可以构建自己的无限迭代器。理论上,下面的迭代器将返回所有奇数。
class InfIter:
"""Infinite iterator to return all
odd numbers"""
def __iter__(self):
self.num = 1
return self
def __next__(self):
num = self.num
self.num += 2
return num
示例运行如下。
>>> a = iter(InfIter())
>>> next(a)
1
>>> next(a)
3
>>> next(a)
5
>>> next(a)
7
等等……
在对这些类型的无限迭代器进行迭代时,请注意包含终止条件。
使用迭代器的好处是可以节省资源。如上所示,我们可以得到所有奇数,而无需将整个数字系统存储在内存中。我们可以在有限的内存中(理论上)拥有无限的项目。
有一种更简单的方法可以在 Python 中创建迭代器。要了解更多信息,请访问:使用 yield 的 Python 生成器。
Python