Python生成器与迭代器

less than 1 minute read

Published:

生成器 Generator

定义

如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator

使用()编写

要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator

L = [x * x for x in range(10)]
g = (x * x for x in range(10))

使用yield编写

函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。

def fib(max):
	n, a, b = 0, 0, 1
	while n < max:
    	yield b
        a, b = b, a + b
        n = n + 1
    return 'done'

调用方法

  • next方法

    当使用()语法编写的生成器生成最后一个元素后,再次调用next方法会产生StopIteration错误。使用yield编写的生成器,当执行到return语句时,一样会产生StopIteration错误,并退出。

    f= fib(5)
    for i in range(6):
        x=next(f)
        print(x)
    
  • for循环调用

    当使用()语法编写的生成器生成最后一个元素后,循环会自动结束。对于yield编写的生成器,当执行到return语句时,循环会自动退出。

      for n in g:
          print(n)
    

迭代器 Iterator

定义

  • 可以直接作用于for循环的对象统称为可迭代对象:Iterable

  • 可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator

区分可迭代对象与迭代器

from collections.abc import Iterator
isinstance((x for x in range(10)), Iterator)
from collections.abc import Iterable
isinstance([], Iterable)

生成器都是Iterator对象,但listdictstr虽然是Iterable,却不是Iterator。把listdictstrIterable变成Iterator可以使用iter()函数。

Python的Iterator对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。Iterator甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。