什么是迭代器

先说一些概念性的东西:

  1. 可迭代对象:列表、元组、集合、字符串、bytes、bytearray、字典和生成器。
  2. __iter__的对象叫可迭代对象;有__next__方法的可迭代对象叫迭代器。
  3. 可迭代对象可以用在for in语句中;可以使用成员运算符(innot in)。
  4. iter函数把一个可迭代对象封装成迭代器。

我们验证一下上面所说的概念是否正确?那我们就以列表为例:

# 验证列表是否有__iter__属性
In [1]: lst = [1, 2, 3]

In [2]: lst.__iter__
Out[2]: <method-wrapper '__iter__' of list object at 0x7f2e726e2288>

# 验证列表是否有__next__属性
In [4]: lst.__next__
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-4-71baddd858f2> in <module>()
----> 1 lst.__next__

AttributeError: 'list' object has no attribute '__next__'

我们使用iter函数把列表转换成迭代器:

In [5]: iter01 = iter(lst)

In [6]: iter01.__next__
Out[6]: <method-wrapper '__next__' of list_iterator object at 0x7f2e7245b160>

In [7]: iter01.__next__()
Out[7]: 1

In [8]: iter01.__next__()
Out[8]: 2

In [9]: iter01.__next__()
Out[9]: 3

In [10]: iter01.__next__()
---------------------------------------------------------------------------
StopIteration                            Traceback (most recent call last)
<ipython-input-10-55a996828c04> in <module>()
----> 1 iter01.__next__()

StopIteration:

迭代器是一种封装。迭代器并非惰性求值,那迭代器有何用途呢?

  lst = list(range(3))
  lst
  next(lst)
  it = iter(lst)
  lst = [
      ['温度', 28, 29, 32, 35, 30, 29, 27],
      ['湿度', 30, 35, 45, 50, 39, 35, 30]
  ]

  for seq in lst:
      it = iter(seq)
      name = next(it)
      print(name)
      for x in it:
          print(x)
# 输出结果为:
温度
28
29
32
35
30
29
27
湿度
30
35
45
50
39
35
30

对于上面的例子,我们完全可以使用遍历列表也可以实现,但是使用列表遍历会占用更多的内存。

  • 可迭代对象
  • 迭代器

以菲波那切数列为例,以类的方式实现:

from itertools import islice

In [74]: class Fib:
    ...:    def __init__(self):
    ...:        self.prev = 0
    ...:        self.curr = 1
    ...:    def __iter__(self):
    ...:        return self
    ...:    def __next__(self):
    ...:        value = self.curr
    ...:        self.curr += self.prev
    ...:        self.prev = value
    ...:        return value
    ...:    

In [75]: f = Fib()

In [76]: list(islice(f, 0, 10))
Out[76]: [1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

迭代器小结

iter函数把可迭代对象转化为迭代器,next函数从迭代器取出下一个元素。迭代器会保存一个指针,指向可迭代对象的当前元素。调用next函数的时候,会返回当前元素,并且把指针指向下一个元素。当没有下一个元素的时候,会抛出StopIteration异常。

for in循环对于可迭代对象:首先调用iter方法转化为迭代器,然后不断的调用next方法,直到抛出StopIteration异常。