按日期分割數據集
-1、 首先我這里的數據集,形式如下圖:
2、由于數據集較大,因次需要導入pandas,利用pandas將csv文件導入到Python中。
3、假設導入的變量為d,那么2014年11月18號這天的數據即可以這樣截?。篸[d[‘time’].str.contains(r’2014-11-18’)]
4、最后再將結果導出為csv文件即可。
import pandasd = pandas.read_csv('d1828.csv')d1118=d[d['time'].str.contains(r'2014-11-18')]d1119=d[d['time'].str.contains(r'2014-11-19')]d1120=d[d['time'].str.contains(r'2014-11-20')]d1121=d[d['time'].str.contains(r'2014-11-21')]d1122=d[d['time'].str.contains(r'2014-11-22')]d1123=d[d['time'].str.contains(r'2014-11-23')]d1124=d[d['time'].str.contains(r'2014-11-24')]d1125=d[d['time'].str.contains(r'2014-11-25')]d1126=d[d['time'].str.contains(r'2014-11-26')]d1127=d[d['time'].str.contains(r'2014-11-27')]d1128=d[d['time'].str.contains(r'2014-11-28')]d1118.to_csv('d1118.csv')d1119.to_csv('d1119.csv')d1120.to_csv('d1120.csv')d1121.to_csv('d1121.csv')d1122.to_csv('d1122.csv')d1123.to_csv('d1123.csv')d1124.to_csv('d1124.csv')d1125.to_csv('d1125.csv')d1126.to_csv('d1126.csv')d1127.to_csv('d1127.csv')d1128.to_csv('d1128.csv')5、這里d1828.csv文件中含有18號到28號的日期,因此最后導出的文件是2014年11月18號到2014年12月28號的文件。
6、同理,當得到某一天的數據后,如果還想繼續按時間(即小時)劃分,也是同樣的方法。用pandas進行較大數據處理時,速度也很快。
新聞熱點
疑難解答