Python中的迭代器漫談

2020-02-23 06:21:43

字體：大中小

來源：轉載

供稿：網友

問題是在Python中進行循環的時候產生的，熟悉Python的都知道，它沒有類似其它語言中的for循環, 只能通過for in的方式進行循環遍歷。最典型的應用就是通過range函數產生一個列表，然后用for in進行操作，如下:

代碼如下:
#!/usr/bin/env python
for i in range(10):
print i

代碼的意義很好理解，range會產生一個列表，用for in最這個列表進行遍歷，就有和類似for(i = 0;i<n;i++)同樣的效果，range函數的詳解可以看這里。問題又來了，range這個對象會產生一個列表，那么這個列表的內容鐵定是存放在內存當中的，當需要的循環數量太大時，是相當占用內存的, 為了統計使用range占用內存的情況，我做了6次使用，分別用range產生100，10000，100000，1000000，10000000,100000000長度的列表，然后統計內存的占用:
代碼如下:
測試代碼占用內存
range(100) 2.0MB
range(10000) 2.2MB
range(100000) 3.8MB
range(1000000) 19.5MB
range(10000000) 168.5MB
range(100000000) 1465.8MB

可以看到，隨著基數的加大，占用內存呈幾何倍數增加，顯然在進行大循環操作的時候，要避免使用range。

為了解決上述問題，python提供了另外一個函數xrange，這個函數和range非常相似，但是占用內存比range會小很多，相關的說明可以查看這里，經過測試，用xrange產生的對象，不管參數是多少，占用內存幾乎都沒有變化。問題又來了，xrange內部是如何實現的，為什么和range性能相差這么大？為了驗證我的猜想，先嘗試用python實現類似xrange的函數zrange:
代碼如下:
#!/usr/bin/env python
class zrange(object):
    def __init__(self,stop):
        self.__pointer=0
        self.stop=stop
    def __iter__(self):
        return self
    def next(self): #python3.0中，改用__next__
        if self.__pointer >= self.stop:
            raise StopIteration
        else:
            self.__pointer = self.__pointer + 1
            return self.__pointer-1
test = zrange(10000000)
for i in test:
    print i

運行的結果和xrange一樣, 對zrange進行內存占用測試，發現和xrange一樣，參數的大小對內存占用幾乎沒有影響。那么它和range的區別在哪里呢？

前面說到，range產生的是一個列表，而無論是自定義的zrange還是系統內置的xrange產生的都是一個對象，像xrange或者zrange產生的對象，就叫做可迭代對象, 它給外部提供了一種遍歷其內部元素，而不用關心其內部實現的方法。上面zrange的實現中, 最關鍵的實現是建立了一個內部指針__pointer, 它記錄當前的訪問的位置, 下次的訪問就可以通過指針的狀態進行相應的操作。

上一篇：Python中的zip函數使用示例

下一篇：Windows8下安裝Python的BeautifulSoup

學習交流

筆記本開機提示error loading os錯誤的問

筆記本開機提示error loading os錯誤的問題怎么解決...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注