實際項目中有這樣的需求,將某一列的值,映射成類別型的數據,這個時候,需要我們將范圍等頻切分,或者等距切分。
具體的做法可以先看某一些特征的具體分布情況,然后我們選擇合適的閾值進行分割。
def age_map(x): if x < 26: return 0 elif x >=26 and x <= 35: return 1 elif x > 35 and x <= 45: return 2 elif pd.isnull(x): #判斷是否為NaN值,== 和in 都無法判斷 return 3 else: return 4
也就是用pandas自帶的函數來表示:
pd.isnull(x)
最后我們可以應用map函數:
data['age'] = data['birth_year'].map(age_map)
以上這篇對pandas數據判斷是否為NaN值的方法詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答