一、前言
1. 現實需求
每種編程語言都有各自的數據類型,其中面向對象的編程語言還允許開發者自定義數據類型(如:自定義類),Python也是一樣。很多時候我們會有這樣的需求:
2.數據格式
如果要將一個系統內的數據通過網絡傳輸給其它系統或客戶端,我們通常都需要先把這些數據轉化為字符串或字節串,而且需要規定一種統一的數據格式才能讓數據接收端正確解析并理解這些數據的含義。XML 是早期被廣泛使用的數據交換格式,在早期的系統集成論文中經??梢钥吹剿纳碛埃蝗缃翊蠹沂褂酶嗟臄祿粨Q格式是JSON(JavaScript Object Notation),它是一種輕量級的數據交換格式。JSON相對于XML而言,更加加單、易于閱讀和編寫,同時也易于機器解析和生成。除此之外,我們也可以自定義內部使用的數據交換格式。
如果是想把數據持久化到本地磁盤,這部分數據通常只是供系統內部使用,因此數據轉換協議以及轉換后的數據格式也就不要求是標準、統一的,只要本系統內部能夠正確識別即可。但是,系統內部的轉換協議通常會隨著編程語言版本的升級而發生變化(改進算法、提高效率),因此通常會涉及轉換協議與編程語言的版本兼容問題,下面要時候的pickle協議就是這樣一個例子。
3. 序列化/反序列化
將對象轉換為可通過網絡傳輸或可以存儲到本地磁盤的數據格式(如:XML、JSON或特定格式的字節串)的過程稱為序列化;反之,則稱為反序列化。
4.相關模塊
本節要介紹的就是Python內置的幾個用于進行數據序列化的模塊:
模塊名稱 | 描述 | 提供的api |
---|---|---|
json | 用于實現Python數據類型與通用(json)字符串之間的轉換 | dumps()、dump()、loads()、load() |
pickle | 用于實現Python數據類型與Python特定二進制格式之間的轉換 | dumps()、dump()、loads()、load() |
shelve | 專門用于將Python數據類型的持久化到磁盤,shelf是一個類似dict的對象,操作十分便捷 | open() |
二、json模塊
大部分編程語言都會提供處理json數據的接口,Python 2.6開始加入了json模塊,且把它作為一個內置模塊提供,無需下載即可使用。
1. 序列化與反序列化
Python的JSON模塊 序列化與反序列化的過程分別叫做:encoding 和 decoding。
新聞熱點
疑難解答