open 遍歷一個大日志文件
使用 readlines() 還是 readline() ?
總體上 readlines() 不慢于python 一次次調用 readline(),因為前者的循環在C語言層面,而使用readline() 的循環是在Python語言層面。
但是 readlines() 會一次性把全部數據讀到內存中,內存占用率會過高,readline() 每次只讀一行,對于讀取 大文件, 需要做出取舍。
如果不需要使用 seek() 定位偏移, for line in open('file') 速度更佳。
使用 readlines(),適合量級較小的日志文件
import osimport timedef check():p = while True:f = open("log.txt", "r+")f = open("result.txt", "a+")f.seek(p, )#readlines()方法filelist = f.readlines()if filelist:for line in filelist:#對行內容進行操作f.write(line)#獲取當前位置,為下次while循環做偏移p = f.tell()print 'now p ', pf.close()f.close()time.sleep()if __name__ == '__main__':check()
使用 readline(),避免內存占用率過大
import osimport timedef check():p = while True:f = open("log.txt", "r+")f = open("result.txt", "a+")f.seek(p, )#while readline()方法while True:l = f.readline()#空行同樣為真if l:#對行內容操作f.write(l)else:#獲取當前位置,作為偏移值p = f.tell()f.close()f.close()breakprint 'now p', ptime.sleep()if __name__ == '__main__':check()