盡管我們可以將所有的NaN替換成0,但是由于并不知道這些值的意義,所以這樣做是個下策。如果它們是開氏溫度,那么將它們置成0這種處理策略就太差勁了。
下面我們用平均值來代替缺失值,平均值根據那些非NaN得到。
from numpy import *datMat = mat([[1,2,3],[4,Nan,6]])numFeat = shape(datMat)[1]for i in range(numFeat): meanVal = mean(datMat[nonzero(~isnan(datMat[:,i].A))[0],i]) #values that are not NaN (a number) datMat[nonzero(isnan(datMat[:,i].A))[0],i] = meanVal #set NaN values to mean
以上這篇numpy 對矩陣中Nan的處理:采用平均值的方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答