實例如下所示:
# -*- coding: utf-8 -*-import numpy as npimport pandas as pdfrom pandas import *from numpy import *data = DataFrame(np.arange(16).reshape(4,4),index = list("ABCD"),columns=list('wxyz'))print dataprint data[0:2] #取前兩行數據print'+++++++++++++'print len(data ) #求出一共多少行print data.columns.size #求出一共多少列print'+++++++++++++'print data.columns #列索引名稱print data.index #行索引名稱print'+++++++++++++'print data.ix[1] #取第2行數據print data.iloc[1] #取第2行數據print'+++++++++++++'print data['x'] #取列索引為x的一列數據print data.loc['A'] #取第行索引為”A“的一行數據,print'+++++++++++++'print data.loc[:,['x','z'] ] #表示選取所有的行以及columns為a,b的列;print data.loc[['A','B'],['x','z']] #表示選取'A'和'B'這兩行以及columns為x,z的列的并集;print'+++++++++++++'print data.iloc[1:3,1:3] #數據切片操作,切連續的數據塊print data.iloc[[0,2],[1,2]] #即可以自由選取行位置,和列位置對應的數據,切零散的數據塊print'+++++++++++++'print data[data>2] #表示選取數據集中大于0的數據print data[data.x>5] #表示選取數據集中x這一列大于5的所有的行print'+++++++++++++'a1=data.copy()print a1[a1['y'].isin(['6','10'])] #表顯示滿足條件:列y中的值包含'6','8'的所有行。print data.mean() #默認對每一列的數據求平均值;若加上參數a.mean(1)則對每一行求平均值;print data['x'].value_counts() #統計某一列x中各個值出現的次數:print data.describe() #對每一列數據進行統計,包括計數,均值,std,各個分位數等。data.to_excel(r'E:/pypractice/Yun/doc/2.xls',sheet_name='Sheet1') #數據輸出至Excel
以上這篇python dataframe常見操作方法:實現取行、列、切片、統計特征值就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答