利用numpy庫
(缺點:有缺失值就無法讀?。?/p>
讀:
import numpy my_matrix = numpy.loadtxt(open("1.csv","rb"),delimiter=",",skiprows=0)
寫:
numpy.savetxt('2.csv', my_matrix, delimiter = ',')
可能遇到的問題:
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position
原因是文件路徑名中含有轉義字符,將路徑中的/換成/即可。
利用pandas庫
讀:(可以處理缺失值)
>>> import pandas as pd>>> df = pd.read_csv('D:/Python//l/B_train1.csv')>>> df.values>>> df.as_matrix(columns=None)
寫:(將dataFrame直接寫入)
>>> testB = test[test.intersection_id.isin(["B"])]>>> pd.DataFrame.to_csv(testB,"D:/Python//k//t5B.csv")#testB是個dataFrame
利用sklearn包中的Imputer處理缺失值
>>> m = df.as_matrix(columns=None)>>> from sklearn.preprocessing import Imputer>>> imp = Imputer(missing_values='NaN', strategy='mean', axis=0)>>> imp.fit(m)Imputer(axis=0, copy=True, missing_values='NaN', strategy='mean', verbose=0)>>> imp.transform(m)
以上這篇python 讀取.csv文件數據到數組(矩陣)的實例講解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答