reindex更多的不是修改pandas對象的索引,而只是修改索引的順序,如果修改的索引不存在就會使用默認的None代替此行。且不會修改原數組,要修改需要使用賦值語句。
series.reindex()
import pandas as pdimport numpy as npobj = pd.Series(range(4), index=['d', 'b', 'a', 'c'])print obj
d 0b 1a 2c 3dtype: int64
print obj.reindex(['a', 'b', 'c', 'd', 'e'])1a 2.0b 1.0c 3.0d 0.0e NaNdtype: float64
多出的索引‘e'會被賦值NaN
內插或填充method
obj1=pd.Series(range(3), index=['a', 'c', 'e'])print obj1.reindex(['a', 'b', 'c', 'd', 'e'],method='pad')
a 0b 0c 1d 1e 2dtype: int64
ffill或pad: 前向(或進位)填充
bfill或backfill: 后向(或進位)填充
dataframe.reindex()
dataframe.reindex()可以改變(行)索引,列或兩者。當只傳入一個序列時,行被重新索引,一次可以對兩個重新索引,可是插值只在行側(0坐標軸)進行
frame = pd.DataFrame(np.arange(9).reshape((3, 3)), index=['a', 'c', 'd'], columns=['c1', 'c2', 'c3'])print frame
c1 c2 c3a 0 1 2c 3 4 5d 6 7 8
states = ['c1', 'b2', 'c3']frame.reindex(columns=states)
c1 | b2 | c3 | |
---|---|---|---|
a | 0 | NaN | 2 |
c | 3 | NaN | 5 |
d | 6 | NaN | 8 |
列名不一樣的會被賦值nan
frame_na=frame.reindex(index=['a', 'b', 'c', 'd'], method='ffill', columns=states)print frame_na
c1 b2 c3a 0 NaN 2b 0 NaN 2c 3 NaN 5d 6 NaN 8
插值只在行側(0坐標軸)進行,但是我們可以在其之后,對nan值進行填充
frame_na.fillna(method='ffill',axis=1)
c1 | b2 | c3 | |
---|---|---|---|
a | 0.0 | 0.0 | 2.0 |
b | 0.0 | 0.0 | 2.0 |
c | 3.0 | 3.0 | 5.0 |
d | 6.0 | 6.0 | 8.0 |
以上這篇python pandas 對series和dataframe的重置索引reindex方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答