最近工作轉型到數據開發領域,想在本地搭建一個數據開發環境。自己有三年python開發經驗,馬上想到使用numpy、scipy、sklearn、pandas搭建一套數據開發環境。
ubuntu的環境,百度中文章比較多,搭建起來非常順利。MAC環境的資料比較少,百度出來的,已經不對了,那我就來補充一篇吧。
MAC自帶python,python的安裝我就不多說了。
安裝pip
我喜歡用pip安裝python庫,非常方便,pip的安裝只能用源碼了。
#下載源代碼https://pypi.python.org/pypi/pip 我去下載的時候是 8.0.2版本#解壓tar xvzf pip8.0.2.tar.gz#安裝cd pip-1.4.1python setup.py install
安裝numpy
numpy是基礎,是scipy等其它庫等基礎,沒什么依賴,安裝起來相對簡單。
pip install numpy
安裝brew
numpy安裝之后,就是安裝scipy了,為什么插了一竿子呢?它依賴fortran庫,fortran庫的安裝需要用到MAC的包管理工具homebrew
#下載brewcurl -LsSf http://github.com/mxcl/homebrew/tarball/master sudo tar xvz -C/usr/local --strip 1
安裝scipy
scipy 是sklearn的基礎,但它依賴gfortran庫,gfortran已經融入到gcc庫中,安裝gcc就好了,有了brew安裝什么包都變得非常簡單了。
#安裝gcc庫brew install gcc#安裝scipypip install scipy后面的安裝,就按步就班了#安裝matplotlib,方便把數據繪圖顯示出來pip install matplotlib#安裝sklearn,我理解這個安裝必須在pandas之前pip install -U numpy scipy scikit-learn#安裝pandaspip install pandas
到這里環境就搭建好了,開搞吧,其實搭起來也非常簡單。提醒下,安裝時注意權限,如果需要權限就在前面加個sudo。