最近接到一個(gè)任務(wù)是這樣的,一臺(tái)solaris服務(wù)器上需要運(yùn)行一個(gè)腳本,每天統(tǒng)計(jì)mysql數(shù)據(jù)庫(kù)中的數(shù)據(jù)并生成報(bào)表。本來(lái)這是一個(gè)可以就事論事的小項(xiàng)目,但是為了以后的靈活和可擴(kuò)展性,我設(shè)計(jì)了一個(gè)使用xml做統(tǒng)計(jì)模版配置的方案。由于在bash下不太好實(shí)現(xiàn)xml的訪問(wèn),因此我考慮用perl來(lái)實(shí)現(xiàn)這個(gè)腳本。
perl是一個(gè)強(qiáng)大的腳本語(yǔ)言,本來(lái)是設(shè)計(jì)應(yīng)用在文本處理方面的,但是后來(lái)發(fā)展的越來(lái)越強(qiáng)大,已經(jīng)可以處理網(wǎng)絡(luò)、圖形、系統(tǒng)、文件等等各個(gè)方面的內(nèi)容。perl本身內(nèi)置了豐富的操作符和函數(shù),外部也有多年積累下來(lái)的大量模塊。但是不知道什么原因在國(guó)內(nèi)好像很少有人用。關(guān)于perl的歷史我就不多說(shuō)了,有興趣可以上網(wǎng)查一下。有一點(diǎn)要說(shuō)的是,目前perl最新的版本是5.8.6,而perl6雖然已經(jīng)設(shè)計(jì)很久了但是由于自舉問(wèn)題目前還沒(méi)有一個(gè)可用的版本。為了解決這個(gè)問(wèn)題,臺(tái)灣的唐宗漢發(fā)起的pugs項(xiàng)目正在快速的實(shí)施中,可能很快就能有結(jié)果了,有興趣的朋友可以多多關(guān)注一下,也許還可以為開(kāi)源世界做點(diǎn)貢獻(xiàn)。
雖然很早以前就了解過(guò)perl,但是從來(lái)就沒(méi)有實(shí)際的用它做過(guò)項(xiàng)目,因此這次的實(shí)現(xiàn)是一個(gè)邊學(xué)邊做的過(guò)程。作為一個(gè)程序員,學(xué)習(xí)一種新的語(yǔ)言總會(huì)有一點(diǎn)慣性思維,加之perl在語(yǔ)法上與c語(yǔ)言比較類似。因此我想在這片文章中主要以c為背景做一個(gè)比較。這種比較不是比較語(yǔ)言上的優(yōu)劣,而是說(shuō)明同樣的功能如何在perl中實(shí)現(xiàn)以及之間的區(qū)別。限于篇幅,具體的技術(shù)實(shí)現(xiàn)的細(xì)節(jié)我就不在這里多說(shuō)了,你可以在末尾的資源一節(jié)中找到很多相關(guān)的文章。如果你沒(méi)有接觸過(guò)perl,我想你可能更希望看到學(xué)習(xí)perl的過(guò)程中可能會(huì)遇到的一些問(wèn)題以及解決方法。
工欲善其事,必先利其器
要寫代碼,首先至少得有一個(gè)編輯器。perl是跨平臺(tái)的一種解釋型語(yǔ)言,可以在unix/linux/windows/mac等平臺(tái)上運(yùn)行。具體對(duì)應(yīng)平臺(tái)上的編輯器,最簡(jiǎn)單的方案是unix下用vi,windows下用ultraedit。當(dāng)然也有商業(yè)化的ide,不過(guò)我嘗試了一下發(fā)現(xiàn)并不是那么的好用,因此我在windows平臺(tái)上以u(píng)ltraedit作為編輯環(huán)境,完成后移植到solaris平臺(tái)上。
關(guān)于環(huán)境的搭建,有這樣幾個(gè)需要注意的地方:
1、 windows平臺(tái)下對(duì)應(yīng)的是activeperl,可以免費(fèi)下載。
2、 去ue的網(wǎng)站上下載perl的autocomp文件,可以實(shí)現(xiàn)自動(dòng)完成功能。
3、 下載perl對(duì)應(yīng)的語(yǔ)法加亮的tag文件并加入到ue中,可以更塊的發(fā)現(xiàn)拼寫錯(cuò)誤。
4、 在ue設(shè)置一個(gè)快捷工具,命令行為c:/perl/bin/perl.exe "%f"(捕獲輸出),可以實(shí)現(xiàn)快速運(yùn)行并顯示結(jié)果。
5、 如果你不喜歡ue,那么我推薦source insight
巧婦難為無(wú)米之炊
起始從某種角度來(lái)說(shuō),程序員和廚子是一樣的。要做出一桌大餐來(lái),首先得看看手上有什么原料,然后才能琢磨一下用這些東西能做出什么好吃的來(lái)。或者說(shuō)想做什么東西,得先備好料才行。
看看我們現(xiàn)在都有什么:一個(gè)編輯器,一個(gè)perl的開(kāi)發(fā)環(huán)境,還有一個(gè)聰明的腦袋。這個(gè)任務(wù)中,我要處理命令行參數(shù)、訪問(wèn)mysql數(shù)據(jù)庫(kù)(sql)、讀寫xml的配置文件以及輸出一個(gè)固定格式的報(bào)表文件。
好了,去查查資料,看看訪問(wèn)數(shù)據(jù)庫(kù)和讀寫xml都需要什么東西。正如同c語(yǔ)言本身帶了很多標(biāo)準(zhǔn)函數(shù)庫(kù)一樣,perl本身也有函數(shù)庫(kù),并把這些函數(shù)庫(kù)稱為module(模塊)。查了一下資料,發(fā)現(xiàn)要訪問(wèn)mysql數(shù)據(jù)庫(kù)需要dbi和dbd::mysql兩個(gè)模塊,那么去哪里找這些模塊呢。這里給大家介紹一個(gè)perl的module集散地 www.cpan.org,這里包含了八千多個(gè)module,可以從這里下載到幾乎各種各樣的module??梢允止は螺d后安裝,也可以使用工具來(lái)自動(dòng)安裝。在windows下是可以使用ppm進(jìn)行自動(dòng)安裝,例如dbd的安裝過(guò)程如下:
c:/>ppm
…
ppm> search dbi
searching in active repositories
… 一大堆與dbi相關(guān)的包的列表,其中就包括dbi這個(gè)包
ppm>install dbi
…
ppm>install dbd::mysql 如果知道模塊的名字也可以直接安裝
…
ppm>quit
如此就安裝完成了。附帶說(shuō)一下,linux下沒(méi)有ppm,但是有類似的方式。輸入命令行
perl –mcpan –e shell
然后install dbi; install dbd-mysql,和上面的操作幾乎是一樣的。
提示:如果是在linux下安裝dbd::mysql模塊,需要把mysql的bin目錄包含在環(huán)境變量path中,否則會(huì)提示找不到mysql_config文件。mysql一般是安裝在/usr/local/mysql下,因此可以通過(guò)執(zhí)行命令行path=$path:/usr/local/bin/mysql/bin來(lái)將此路徑加入到環(huán)境變量中。
訪問(wèn)xml有幾種包可以選擇:使用dom和simple模塊。simple模塊是把xml用perl的數(shù)組方式表示,而dom是w3c維護(hù)的一個(gè)基于樹(shù)的xml文檔標(biāo)準(zhǔn)。具體用哪種就看個(gè)人的需要了。我使用的是dom,因此要安裝xml-dom包,方法同上。
芝麻開(kāi)門
說(shuō)起編程語(yǔ)言,簡(jiǎn)單的來(lái)說(shuō)無(wú)非就是這樣幾個(gè)必不可少的基本元素:變量、數(shù)據(jù)、表達(dá)式、流程控制語(yǔ)句(包括條件、分支、循環(huán))、函數(shù)、對(duì)象。具體到語(yǔ)言上,大部分的內(nèi)容只是表達(dá)的形式不同而已。而perl與c又有什么區(qū)別呢?
首先要知道,perl是一種腳本語(yǔ)言。所謂的腳本,就是沒(méi)有主函數(shù),從最開(kāi)始一行一行的按照順序解釋執(zhí)行(老版basic不也是如此嗎)。因此,盡管把你的思路轉(zhuǎn)化為流程用perl表達(dá)出來(lái)吧。
其次,perl的設(shè)計(jì)中參考了很多語(yǔ)言的長(zhǎng)處,并避免了設(shè)計(jì)上的缺陷。因此perl的很多語(yǔ)法你可能都會(huì)覺(jué)得似曾相識(shí)。我把perl的語(yǔ)法總結(jié)了一下,和c語(yǔ)言做了一個(gè)簡(jiǎn)單的對(duì)比表格。表格左右兩邊的語(yǔ)句是c和perl對(duì)應(yīng)表達(dá)同一個(gè)功能各自的不同方式。如果讀者有c語(yǔ)言的經(jīng)驗(yàn),相信看到這個(gè)對(duì)比可以很快的上手吧?
語(yǔ)法元素 | c | perl | perl語(yǔ)法說(shuō)明 |
注釋 | /* … */ | # … | 只支持單行注釋 |
變量 | int a, b, c; char c=’a’; int x[10]; | my ($a, $b, $c); my $c='a'; my @x; my %h; | 聲明使用my標(biāo)示 表示值的變量以$開(kāi)頭,表示數(shù)組的變量以@開(kāi)頭,表示哈希表的變量以%開(kāi)頭。 聲明可以省略(不建議) |
字符串 | char* h1=”hello/n”; char* h2=”hello//n”; | $h1=”hello/n”; $h2=’hello/n’; | 雙引號(hào)解釋內(nèi)部的/n,而單引號(hào)則不解釋 |
一維數(shù)組 | int arr[10]; arr[0]=0; for(i=0;i<10;i++) arr[i]=i; | my @arr; $arr[0]=0; @arr[3..5]=(3..5); | 數(shù)組聲明以@標(biāo)示 動(dòng)態(tài)數(shù)組,不需要指定大小 數(shù)組下標(biāo)從0開(kāi)始 訪問(wèn)數(shù)組元素值的時(shí)候,要以$開(kāi)頭表示訪問(wèn)的是數(shù)值 [3..5]表示數(shù)組中下標(biāo)為3到5之間的元素組成的數(shù)組 數(shù)組之間可以直接賦值 |
多維數(shù)組 | int arr[10][10]; arr[0][1]=9; | my @arr; $arr[0][1]=9; | perl并不直接支持多維數(shù)組,而是以數(shù)組引用的方式間接支持。例如arr[0]的內(nèi)容就是一個(gè)數(shù)組的引用地址。 |
指針 | char c; int* x=&c; c='a'; printf(*x); | my $c; my $x=/$c; $c='a'; print $x; | /和c中的&類似,意思是取引用 |
void hello() { printf(“hello/n”); } void (*hi)()=hello; (*p)(); | sub hello{ print "hello/n"; } my $hi = *hello; &$hi; | &表示調(diào)用函數(shù) *取函數(shù)的代碼地址 不必用括號(hào)把參數(shù)括起來(lái) 調(diào)用時(shí)的括號(hào)也是可選的 | |
條件語(yǔ)句 | if (x>0) x=0; x>0 ? x=0 : ; | if ($x>0) { $x=0; } $x=0 if $x>0; $x=0 unless $x<=0; $x>0 ? $x=0 : ; | if 結(jié)構(gòu)可以反轉(zhuǎn),意義不變,注意前句沒(méi)有分號(hào)。 顧名思義, unless是“除非”的意思。這里的四個(gè)表達(dá)方式是等價(jià)的。注意第一種方式中,條件部分的圓括號(hào)和語(yǔ)句部分的花括號(hào)是不可省略的。 |
循環(huán)語(yǔ)句 | 略 | foreach (@arry) foreach my $key(@ary) foreach $count (1..10) | for/while的語(yǔ)法都和c類似。 foreach關(guān)鍵字也可以用for,意義不變。 |
函數(shù) | int max(int x, int y) { return x>y?x:y; }
int n=max(1,2); | sub max { my ($x, $y)[email protected]_; return $x>$y?$x:$y; } my $n=max(1,2) | 注意下劃線”_”也是一個(gè)合法的變量名。而@_是perl內(nèi)置的一個(gè)數(shù)組,內(nèi)容為函數(shù)的參數(shù)。 my ($x, $y) 表示聲明了一個(gè)有兩個(gè)元素的數(shù)組,并將兩個(gè)元素映射到$x和$y上。 ($x,$y)[email protected]_;則表示兩個(gè)數(shù)組之間的復(fù)制,@_中對(duì)應(yīng)的元素的值就賦值給了$x和$y.這是一個(gè)簡(jiǎn)便的寫法,也可以這樣寫 my $x=$_[0]; my $y=$_[1]; return是可選的,默認(rèn)返回最后一個(gè)表達(dá)式的值 |
語(yǔ)法約束 | 1. 編譯時(shí)打開(kāi)編譯器所有的警告選項(xiàng) 2. 使用lint工具 | 3. perl –w myprogram.pl 打開(kāi)運(yùn)行警告開(kāi)關(guān),如果運(yùn)行時(shí)perl檢查到了可能的錯(cuò)誤,會(huì)顯示警告信息,否則它默認(rèn)是什么也不提示繼續(xù)執(zhí)行。 4. #!/usr/bin/perl –w 在代碼文件第一行中加入-w選項(xiàng)開(kāi)關(guān) 5. use strict; 使用嚴(yán)格語(yǔ)法約束 | |
運(yùn)行 | 編譯后直接執(zhí)行 | 1. perl myprogram.pl 手工執(zhí)行 2. #!/usr/bin/perl unix下在代碼第一行加入,然后給文件加上可執(zhí)行的屬性 chmod +x myprogram.pl,之后就可以用./myprogram.pl命令來(lái)運(yùn)行。 3. windows下,安裝activeperl的時(shí)候,已經(jīng)將.pl后綴的文件和perl的解釋程序關(guān)聯(lián)起來(lái)了,因此直接雙擊文件圖標(biāo)就可以運(yùn)行。 |
從框架開(kāi)始
perl有很多表達(dá)方式,我們可以選擇一種自己熟悉、容易理解的方式來(lái)寫perl的程序。例如,你是一個(gè)經(jīng)驗(yàn)豐富的c程序員,那么你可以選擇以c的風(fēng)格來(lái)寫perl程序。下面是一個(gè)小小的樣板框架
#!/usr/bin/perl -w
use strict;
# 程序開(kāi)始的第一行語(yǔ)句,調(diào)用main函數(shù)
main();
# 定義main函數(shù)
sub main
{
…
}
在這個(gè)框架下面,你幾乎可以容易就開(kāi)始你的perl開(kāi)發(fā)了。如果需要處理命令行參數(shù),就可以稍微的擴(kuò)展一下這個(gè)框架。
#!/usr/bin/perl -w
use strict;
use getopt::std;
main();
my $configfile;
sub processoptions
{
my $version = '1.0.0';
my $usage = "pp.pl [-v | -c configfile]/n";
my $opts={};
die $usage unless( getopts("c:v", $opts) );
die $version if ($opts->{'v'});
$configfile=$opts->{'c'} ? $opts->{'c'} : 'config.xml' ;
}
sub main
{
processoptions();
print $configfile;
…
}
實(shí)際上,剩余的工作和以往的工作差不多了,編寫一個(gè)一個(gè)的函數(shù),并實(shí)現(xiàn)你的業(yè)務(wù)邏輯。對(duì)于你這樣一個(gè)聰明的程序員來(lái)說(shuō),學(xué)會(huì)perl是一個(gè)很容易的事情。
常見(jiàn)問(wèn)題
以我的學(xué)習(xí)經(jīng)驗(yàn)來(lái)看,在開(kāi)發(fā)的過(guò)程中可能有一些常用但是很分散的細(xì)節(jié)問(wèn)題會(huì)讓你感到困惑。
1、 程序的入口參數(shù)怎么?。?br />
內(nèi)置數(shù)組@argv包含了所有的運(yùn)行參數(shù)??梢源蛴〕鰜?lái)看看 print @argv;
2、 函數(shù)如何傳參數(shù)、取參數(shù)?
每個(gè)函數(shù)內(nèi)部都有一個(gè)內(nèi)置的數(shù)組 @_ ,這個(gè)數(shù)組的元素就是函數(shù)的參數(shù)。例如傳入的第一個(gè)參數(shù)就是$_[0],第二個(gè)是$_[1]。唔,如你所見(jiàn),perl的函數(shù)參數(shù)就是c中的動(dòng)態(tài)參數(shù)。
3、 默認(rèn)變量是什么
這個(gè)可能會(huì)把你的頭搞暈。有一個(gè)內(nèi)置變量 $_ ,
4、 顯示消息、退出常見(jiàn)的簡(jiǎn)單寫法
die ‘error on program’;
也可以在條件不滿足的情況下使用
die ‘configuration error’ unless($doc->getdocumentelement);
5、 格式化輸出
可以用簡(jiǎn)單的print語(yǔ)句進(jìn)行一般的輸出操作,如果需要復(fù)雜的格式化輸出,可以使用printf語(yǔ)句……跟c的用法幾乎是一樣的。
printf("pi=%.6f", 355/113);
6、 =>是什么東西?
在使用hash表的時(shí)候,可以經(jīng)常看到=>這個(gè)符號(hào)。例如這樣的一個(gè)定義:
my $account={
'simon'=> '[email protected]',
'jesse'=> '[email protected]'
};
其實(shí),=>符號(hào)跟逗號(hào)”,”是等價(jià)的。perl里面的hash表事實(shí)上是一個(gè)數(shù)組,只是把奇數(shù)位元素看做是key(鍵),而把偶數(shù)位的元素看做是value(值)。
7、 關(guān)于引用的一點(diǎn)說(shuō)明
perl的引用類似c的指針,所謂的引用事實(shí)上就是地址。取一個(gè)變量的地址用反斜杠”/”操作符,例如 $p=/$x; 那么$p就是一個(gè)指向$x變量的指針。要引用指針的值,使用”$”操作符,例如 print $$p; 就是打印$x的值。
引用不單單可以引用變量,也可以引用數(shù)組、hash表、函數(shù),取函數(shù)的地址可以使用*操作符。
還能做什么
perl作為一個(gè)功能強(qiáng)大的腳本語(yǔ)言,可以應(yīng)用在web 編程、數(shù)據(jù)庫(kù)、xml、系統(tǒng)管理、圖形圖像、自然語(yǔ)言、壓縮、加密、郵件系統(tǒng)、軟件測(cè)試等各個(gè)地方。在cpan上,你可以找到各種各樣你所需要的模塊支持。例如,你可以:
編寫系統(tǒng)管理的腳本
和apache結(jié)合起來(lái),編寫cgi程序
編寫動(dòng)態(tài)網(wǎng)頁(yè)
使用net命名空間下的類編寫網(wǎng)絡(luò)應(yīng)用程序
使用authen::captcha模塊實(shí)現(xiàn)提交時(shí)的驗(yàn)證碼的功能
使用storable模塊處理perl的各種數(shù)據(jù)結(jié)構(gòu)
使用gd/image::magick模塊處理圖形
等等…
資源
www.perl.org perl的官方站點(diǎn)
www.perl.com o’reily 維護(hù)的關(guān)于perl的站點(diǎn)
www.cpan.org perl的module資源大全
www.perlchina.com 中國(guó)perl協(xié)會(huì)
www.pm.org 世界各地的perl用戶組織
www.perlmonks.org 用perl寫詩(shī) j
http://www-128.ibm.com/developerworks/cn/linux/sdk/perl/ ibm社區(qū)的perl系列文章
新聞熱點(diǎn)
疑難解答