問題是在Python中進行循環的時候產生的,熟悉Python的都知道,它沒有類似其它語言中的for循環, 只能通過for in的方式進行循環遍歷。最典型的應用就是通過range函數產生一個列表,然后用for in進行操作,如下:
代碼如下:
#!/usr/bin/env python
for i in range(10):
print i
代碼的意義很好理解,range會產生一個列表,用for in最這個列表進行遍歷,就有和類似for(i = 0;i<n;i++)同樣的效果,range函數的詳解可以看這里。問題又來了,range這個對象會產生一個列表,那么這個列表的內容鐵定是存放在內存當中的,當需要的循環數量太大時,是相當占用內存的, 為了統計使用range占用內存的情況,我做了6次使用,分別用range產生100,10000,100000,1000000,10000000,100000000長度的列表,然后統計內存的占用:
代碼如下:
測試代碼 占用內存
range(100) 2.0MB
range(10000) 2.2MB
range(100000) 3.8MB
range(1000000) 19.5MB
range(10000000) 168.5MB
range(100000000) 1465.8MB
可以看到,隨著基數的加大,占用內存呈幾何倍數增加,顯然在進行大循環操作的時候,要避免使用range。
為了解決上述問題,python提供了另外一個函數xrange,這個函數和range非常相似,但是占用內存比range會小很多,相關的說明可以查看這里,經過測試,用xrange產生的對象,不管參數是多少,占用內存幾乎都沒有變化。問題又來了,xrange內部是如何實現的,為什么和range性能相差這么大?為了驗證我的猜想,先嘗試用python實現類似xrange的函數zrange:
代碼如下:
#!/usr/bin/env python
class zrange(object):
def __init__(self,stop):
self.__pointer=0
self.stop=stop
def __iter__(self):
return self
def next(self): #python3.0中,改用__next__
if self.__pointer >= self.stop:
raise StopIteration
else:
self.__pointer = self.__pointer + 1
return self.__pointer-1
test = zrange(10000000)
for i in test:
print i
運行的結果和xrange一樣, 對zrange進行內存占用測試,發現和xrange一樣,參數的大小對內存占用幾乎沒有影響。那么它和range的區別在哪里呢?
前面說到,range產生的是一個列表,而無論是自定義的zrange還是系統內置的xrange產生的都是一個對象,像xrange或者zrange產生的對象,就叫做可迭代對象, 它給外部提供了一種遍歷其內部元素,而不用關心其內部實現的方法。上面zrange的實現中, 最關鍵的實現是建立了一個內部指針__pointer, 它記錄當前的訪問的位置, 下次的訪問就可以通過指針的狀態進行相應的操作。
新聞熱點
疑難解答