(1)、導庫
import pandas as pdfrom pandas import Series
(2)、讀取csv文件的兩種方式
#讀取csv文件的兩種方式f = open('E:/建模/第5周/data/ex1.csv') #方法一df = pd.read_csv(f)print(df)f.closef = open('E:/建模/第5周/data/ex1.csv') #方法二,必須指定分隔符為',',否則會讀取失敗df = pd.read_table(f,sep=',')print(df)f.close
(2)、根據需要條件讀取csv文件
#根據需要條件讀取csv文件f = open('E:/建模/第5周/data/csv_mindex.csv') df = pd.read_csv(f,header=None) #不需要表頭df = pd.read_csv(f,names=['a','b','c','d','message']) #添加表頭df = pd.read_csv(f,names=['a','b','c','d','message'],index_col = 'message') #指定某一列作為行索引df = pd.read_csv(f,index_col = ['key1','key2']) #指定多列作為行索引print(df)f.close
(3)、利用正則表達式讀取不同含有不同分隔符的文件
#利用正則表達式讀取不同含有不同分隔符的文件f = open('E:/建模/第5周/data/ex3.txt') df = pd.read_table(f,sep='/s+')print(df)
(4)、根據需要選擇需要讀的行
#根據需要選擇需要讀的行f = open('E:/建模/第5周/data/ex4.csv') df = pd.read_table(f,sep=',',skiprows=[0,2,3]) #跳過不想讀的行print(df)
(5)、處理缺失值
#處理缺失值f = open('E:/建模/第5周/data/ex5.csv') df = pd.read_table(f,sep=',',na_values='world') #如果數據中有'world',也會視為缺失值print(df)
(6)、逐行讀取文件
#逐行讀取文件f = open('E:/建模/第5周/data/ex6.csv') df = pd.read_table(f,sep=',',nrows=5) #只讀取前面5行print(df)
(7)、將dataframe數據寫入csv文件
#將dataframe數據寫入csv文件f = open('E:/建模/第5周/data/ex5.csv') data = pd.read_csv(f)data.to_csv('E:/建模/第5周/data/out.csv') #將dataframe輸出到csv文件中data.to_csv('E:/建模/第5周/data/out.csv',na_rep='ok') #將缺失值補上‘ok'data.to_csv('E:/建模/第5周/data/out.csv',header=None) #不設置表頭data.to_csv('E:/建模/第5周/data/out.csv',columns=['a','b']) #寫出指定的列
(8)、將csv文件讀取位Series
#將csv文件讀取位Seriesf = open('E:/建模/第5周/data/tseries.csv') series = Series.from_csv(f,parse_dates=True)print(series)
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持武林網之家。
新聞熱點
疑難解答