產(chǎn)生器

1、為什麼需要生成器

透過上面的學(xué)習(xí)，可以知道清單生成式，我們可以直接建立一個清單。但是，受到記憶體限制，列表容量肯定是有限的。而且，創(chuàng)建一個包含 1000 萬個元素的列表，不僅佔(zhàn)用很大的存儲空間，如果我們僅僅需要訪問前面幾個元素，那後面絕大多數(shù)元素佔(zhàn)用的空間都白白浪費(fèi)了。

所以，如果列表元素可以依照某種演算法推導(dǎo)出來，那我們是否可以在循環(huán)的過程中不斷推導(dǎo)出後續(xù)的元素呢？這樣就不必創(chuàng)建完整的 list，從而節(jié)省大量的空間。在 Python 中，這種一邊循環(huán)一邊計(jì)算的機(jī)制，稱為生成器：generator。

在 Python 中，使用了 yield 的函數(shù)稱為生成器（generator）。

跟普通函數(shù)不同的是，生成器是一個傳回迭代器的函數(shù)，只能用於迭代操作，更簡單點(diǎn)理解生成器就是一個迭代器。

在呼叫生成器運(yùn)行的過程中，每次遇到 yield 時函數(shù)會暫停並保存目前所有的運(yùn)行信息，返回yield的值。並在下一次執(zhí)行 next()方法時從目前位置繼續(xù)運(yùn)行。

那麼要如何建立一個生成器呢？

2、生成器的建立

最簡單、最簡單的方法就是把一個清單產(chǎn)生式的[] 改成()

# -*- coding: UTF-8 -*-
gen= (x * x for x in range(10))
print(gen)

輸出的結(jié)果：

<generator object <genexpr> at 0x0000000002734A40>

建立List 和generator 的差異僅在於最外層的[] 和() 。但是生成器並不真正創(chuàng)建數(shù)字列表，而是返回一個生成器，這個生成器在每次計(jì)算出一個條目後，把這個條目「產(chǎn)生」 ( yield ) 出來。生成器表達(dá)式使用了“惰性計(jì)算” ( lazy evaluation，也有翻譯為“延遲求值”，我以為這種按需調(diào)用call by need 的方式翻譯為惰性更好一些)，只有在檢索時才被賦值（ evaluated ），所以在列表比較長的情況下使用記憶體上更有效。

那麼竟然知道如何建立一個生成器，那要怎麼查看裡面的元素呢？

3、遍歷生成器的元素

按我們的思維，遍歷用for 循環(huán)，對了，我們可以試試：

# -*- coding: UTF-8 -*-
gen= (x * x for x in range(10))
for num  in  gen :
print(num)

沒錯，直接這樣就可以遍歷出來了。當(dāng)然，上面也提到了迭代器，那麼用 next() 可以遍歷嗎？當(dāng)然也是可以的。

4、以函數(shù)的形式實(shí)作生成器

上面也提到，創(chuàng)建生成器最簡單、最簡單的方法就是把一個列表生成式的[]改成()。為啥突然來個以函數(shù)的形式來創(chuàng)建呢？

其實(shí)產(chǎn)生器也是迭代器，但你只能對其迭代一次。這是因?yàn)樗鼈儊K沒有把所有的值存在記憶體中，而是在運(yùn)行時產(chǎn)生值。你透過遍歷來使用它們，要麼用一個「for」循環(huán)，要麼將它們傳遞給任意可以進(jìn)行迭代的函數(shù)和結(jié)構(gòu)。而且實(shí)際運(yùn)用中，大多數(shù)的生成器都是透過函數(shù)來實(shí)現(xiàn)的。那我們該如何透過函數(shù)來創(chuàng)建呢？

先不急，來看下這個例子：

# -*- coding: UTF-8 -*-
def my_function():
    for i in range(10):
        print ( i )
my_function()

輸出的結(jié)果：

如果我們需要把它變成生成器，我們只需要把print ( i ) 改為yield i 就可以了，具體看下修改後的例子：

# -*- coding: UTF-8 -*-
def my_function():
    for i in range(10):
        yield i
print(my_function())

輸出的結(jié)果：

<generator object my_function at 0x0000000002534A40>

但是，這個例子非常不適合使用生成器，發(fā)揮不出生成器的特點(diǎn)，生成器的最好的應(yīng)用應(yīng)該是：你不想在同一時間將所有計(jì)算出來的大量結(jié)果集分配到記憶體當(dāng)中，特別是結(jié)果集裡還包含循環(huán)。因?yàn)檫@樣會耗很大的資源。

例如下面是一個計(jì)算斐波那契數(shù)列的生成器：

# -*- coding: UTF-8 -*-
def fibon(n):
    a = b = 1
    for i in range(n):
        yield a
        a, b = b, a + b
# 引用函數(shù)
for x in fibon(1000000):
    print(x , end = ' ')

運(yùn)行的效果：

你看，運(yùn)行一個這麼打的參數(shù)，也不會說有卡死的狀態(tài)，因?yàn)檫@種方式不會使用太大的資源。這裡，最難理解的就是 generator 和函數(shù)的執(zhí)行流程不一樣。函數(shù)是順序執(zhí)行，遇到 return 語句或最後一行函數(shù)語句就回傳。而變成 generator 的函數(shù)，在每次呼叫 next() 的時候執(zhí)行，遇到 yield語句返回，再次執(zhí)行時從上次返回的 yield 語句處繼續(xù)執(zhí)行。

例如這個例子：

# -*- coding: UTF-8 -*-
def odd():
    print ( 'step 1' )
    yield ( 1 )
    print ( 'step 2' )
    yield ( 3 )
    print ( 'step 3' )
    yield ( 5 )
o = odd()
print( next( o ) )
print( next( o ) )
print( next( o ) )
輸出的結(jié)果：
step 1
1
step 2
3
step 3
5

可以看到，odd 不是普通函數(shù)，而是 generator，在執(zhí)行過程中，遇到 yield 就中斷，下次又繼續(xù)執(zhí)行。執(zhí)行 3 次 yield 後，已經(jīng)沒有 yield 可以執(zhí)行了，如果你繼續(xù)打印 print( next( o ) ) ,就會報錯的。所以通常在 generator 函數(shù)中都要對錯誤進(jìn)行捕獲。

5、列印楊輝三角

透過學(xué)習(xí)了生成器，我們可以直接利用生成器的知識點(diǎn)來列印楊輝三角：

# -*- coding: UTF-8 -*-
def triangles( n ):         # 楊輝三角形
    L = [1]
    while True:
        yield L
        L.append(0)
        L = [ L [ i -1 ] + L [ i ] for i in range (len(L))]
n= 0
for t in triangles( 10 ):   # 直接修改函數(shù)名即可運(yùn)行
    print(t)
    n = n + 1
    if n == 10:
        break

輸出的結(jié)果為：

[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4, 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]

繼續(xù)學(xué)習(xí)