亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Regex > 正文

正則表達式 學習參考 推薦入門者看

2020-03-16 21:16:36
字體:
來源:轉載
供稿:網友
正則表達式(Regular Expression)是一種匹配模式,描述的是一串文本的特征。他可以實現一些可變字符的替換。
 
 

1       概述

正則表達式(Regular Expression)是一種匹配模式,描述的是一串文本的特征。

正如自然語言中“高大”、“堅固”等詞語抽象出來描述事物特征一樣,正則表達式就是字符的高度抽象,用來描述字符串的特征。

正則表達式(以下簡稱正則,Regex)通常不獨立存在,各種編程語言和工具作為宿主語言提供對正則的支持,并根據自身語言的特點,進行一定的剪裁或擴展。

正則入門很容易,有限的語法規則很容易掌握,但是目前正則的普及率并不高,主要是因為正則的流派眾多,各種宿主語言提供的文檔都過多的關注于自身的一些細節,而這些細節通常是初學者并不需要關注的。

當然,如果想要深入的了解正則表達式,這些細節又是必須被關注的,這是后話,讓我們先從正則的基礎開始,進入正則表達式的世界。

2       正則表達式基礎

2.1     基本概念

2.1.1  字符串組成

正則表達式 學習參考 推薦入門者看


對于字符串“a5”,是由兩個字符“a”、“5”以及三個位置組成的,這一點對于正則表達式的匹配原理理解很重要。

2.1.2  占有字符和零寬度

正則表達式匹配過程中,如果子表達式匹配到的是字符內容,而非位置,并被保存到最終的匹配結果中,那么就認為這個子表達式是占有字符的;如果子表達式匹配的僅僅是位置,或者匹配的內容并不保存到最終的匹配結果中,那么就認為這個子表達式是零寬度的。

占有字符還是零寬度,是針對匹配的內容是否保存到最終的匹配結果中而言的。

占有字符是互斥的,零寬度是非互斥的。也就是一個字符,同一時間只能由一個子表達式匹配,而一個位置,卻可以同時由多個零寬度的子表達式匹配。

2.1.3  正則表達式構成

正則表達式由兩種字符構成。一種是在正則表達式中具體特殊意義的“元字符”,另一種是普通的“文本字符”。

元字符可以是一個字符,如“^”,也可以是一個字符序列,如“/w”。

2.2     元字符(Meta Character)

2.2.1  […] 字符組(Character Classes)

字符組可以匹配[ ]中包含的任意一個字符。雖然可以是任意一個,但只能是一個。

字符組支持由連字符“-”來表示一個范圍。當“-”前后構成范圍時,要求前面字符的碼位小于后面字符的碼位。

[^…] 排除型字符組。排除型字符組表示任意一個未列出的字符,同樣只能是一個。排除型字符組同樣支持由連字符“-”來表示一個范圍。

 

 

表達式

說明

[abc]

表示“a”或“b”或“c”

[0-9]

表示0~9中任意一個數字,等價于[0123456789]

[/u4e00-/u9fa5]

表示任意一個漢字

[^a1<]

表示除“a”、“1”、“<”外的其它任意一個字符

[^a-z]

表示除小寫字母外的任意一個字符

 

舉例:

[0-9][0-9]”在匹配“Windows 2003”時,匹配成功,匹配的結果為“20”。

[^inW]”在匹配“Windows 2003”時,匹配成功,匹配的結果為“d”。

2.2.2  常見字符范圍縮寫

對于一些常用的字符范圍,如數字等,由于非常常用,即使使用[0-9]這樣的字符組仍顯得麻煩,所以定義了一些元字符,來表示常見的字符范圍。

 

 

表達式

說明

/d

任意一個數字,相當于[0-9],即0~9 中的任意一個

/w

任意一個字母或數字或下劃線,相當于[a-zA-Z0-9_]

/s

任意空白字符,相當于[ /r/n/f/t/v]

/D

任意一個非數字字符,/d取反,相當于[^0-9]

/W

/w取反,相當于[^a-zA-Z0-9_]

/S

任意非空白字符,/s取反,相當于[^ /r/n/f/t/v]

 

舉例:

/w/s/d”在匹配“Windows 2003”時,匹配成功,匹配的結果為“s 2”。

2.2.3  . 小數點

小數點可以匹配除“/n”以外的任意一個字符。如果要匹配包括“/n”在內的所有字符,一般用[/s/S],或者是用“.”加(?s)匹配模式來實現。

 

 

表達式

說明

.

匹配除了換行符 /n 以外的任意一個字符

 

2.2.4  其它元字符

 

 

表達式

說明

^

匹配字符串開始的位置,不匹配任何字符

$

匹配字符串結束的位置,不匹配任何字符

/b

匹配單詞邊界,不匹配任何字符

 

舉例:

^a”在匹配“cba”時,匹配失敗,因為表達式要求開始位置后面是字符“a”,而“cba”顯然是不滿足的。

/d$”在匹配“123”時,匹配成功,匹配結果為“3”,這個表達式要求匹配結尾處的數字,如果結尾處不是數字,如“123abc”,則是匹配失敗的。

2.2.5  轉義字符

一些不可見字符,或是在正則中具有特殊意義的元字符,如想匹配字符本身,需要用“/”對其進行轉義。

 

 

 

表達式

說明

/r,/n

回車和換行

//

匹配“/”本身

/^,/$,/.

分別匹配“^”、“$”和“.”

 

以下字符在匹配其本身時,通常需要進行轉義。在實際應用中,根據具體情況,需要轉義的字符可能不止如下所列字符

 .  $  ^  {  [  (  |  )  *  +  ?  /

2.2.6  量詞(Quantifier)

量詞表示一個子表達式可以匹配的次數。量詞可以用來修飾一個字符、字符組,或是用()括起來的子表達式。一些常用的量詞被定義成獨立的元字符。

 

 

表達式

說明

舉例

{m}

表達式匹配m次

“/d{3}”相當于“/d/d/d ”

“(abc){2}”相當于“abcabc”

{m,n}

表達式匹配最少m次,最多n次

“/d{2,3}”可以匹配“12”或“321”等2到3位的數字

{m,}

表達式至少匹配m次

“[a-z]{8,}”表示至少8位以上的字母

?

表達式匹配0次或1次,相當于{0,1}

“ab?”可以匹配“a”或“ab”

*

表達式匹配0次或任意多次,相當于{0,}

“<[^>]*>”中“[^>]*”表示0個或任意多個不是“>”的字符

+

表達式匹配1次或意多次,至少1次,相當于{1,}

“/d/s+/d”表示兩個數字中間,至少有一個以上的空白字符

 

注意:在不是動態生成的正則表達式中,不要出現“{1}”這樣的量詞,如“/w{1}”在結果上等價于“/w”,但是會降低匹配效率和可讀性,屬于畫蛇添足的做法。

2.2.7  分支結構(Alternation)

當一個字符串的某一子串具有多種可能時,采用分支結構來匹配,“|”表示多個子表達式之間“或”的關系,“|”是以()限定范圍的,如果在“|”的左右兩側沒有()來限定范圍,那么它的作用范圍即為“|”左右兩側整體。

 

 

表達式

說明

|

多個子表達式之間取“或”的關系

 

舉例:

^aa|b$”在匹配“cccb”時,是可以匹配成功的,匹配的結果是“b”,因為這個表達式表示匹配“^aa”或“b$”,而“b$”在匹配“cccb ”時是可以匹配成功的。

^(aa|b)$”在區配“cccb”時,是匹配失敗的,因為這個表達式表示在“開始”和“結束”位置之間只能是“aa”或“b”,而“cccb”顯然是不滿足的。

3       正則表達式進階

3.1     捕獲組(Capture Group)

捕獲組就是把正則表達式中子表達式匹配的內容,保存到內存中以數字編號或手動命名的組里,以供后面引用。

 

 

表達式

說明

(Expression)

普通捕獲組,將子表達式Expression匹配的內容保存到以數字編號的組里

(?<name> Expression)

命名捕獲組,將子表達式Expression匹配的內容保存到以name命名的組里

 

普通捕獲組(在不產生歧義的情況下,簡稱捕獲組)是以數字進行編號的,編號規則是以“(”從左到右出現的順序,從1開始進行編號。通常情況下,編號為0的組表示整個表達式匹配的內容。

命名捕獲組可以通過捕獲組名,而不是序號對捕獲內容進行引用,提供了更便捷的引用方式,不用關注捕獲組的序號,也不用擔心表達式部分變更會導致引用錯誤的捕獲組。

3.2     非捕獲組

一些表達式中,不得不使用( ),但又不需要保存( )中子表達式匹配的內容,這時可以用非捕獲組來抵消使用( )帶來的副作用。

 

 

表達式

說明

(?:Expression)

進行子表達式Expression的匹配,并將匹配內容保存到最終的整個表達式的區配結果中,但Expression匹配的內容不單獨保存到一個組內

 

3.3     反向引用

捕獲組匹配的內容,可以在正則表達式的外部程序中進行引用,也可以在表達式中進行引用,表達式中引用的方式就是反向引用。

反向引用通常用來查找重復的子串,或是限定某一子串成對出現。

 

 

表達式

說明

/1,/2

對序號為1和2的捕獲組的反向引用

/k<name>

對命名為name的捕獲組的反向引用

 

舉例:

(a|b)/1”在匹配“abaa”時,匹配成功,匹配到的結果是“aa”。“(a|b)”在嘗試匹配時,雖然既可以匹配“a”,也可以匹配“b”,但是在進行反向引用時,對應()中匹配的內容已經是固定的了。

3.4     環視(Look Around)

環視只進行子表達式的匹配,匹配內容不計入最終的匹配結果,是零寬度的。

環視按照方向劃分有順序和逆序兩種,按照是否匹配有肯定和否定兩種,組合起來就有四種環視。環視相當于對所在位置加了一個附加條件。

 

 

 

表達式

說明

(?<=Expression)

逆序肯定環視,表示所在位置左側能夠匹配Expression

(?<!Expression)

逆序否定環視,表示所在位置左側不能匹配Expression

(?=Expression)

順序肯定環視,表示所在位置右側能夠匹配Expression

(?!Expression)

順序否定環視,表示所在位置右側不能匹配Expression

 

舉例:

(?<=Windows )/d+”在匹配“Windows 2003”時,匹配成功,匹配結果為“2003”。我們知道“/d+”表示匹配一個以上的數字,而“(?<=Windows )”相當于一個附加條件,表示所在位置左側必須為“Windows ”,它所匹配的內容并不計入匹配結果。同樣的正則在匹配“Office 2003”時,匹配失敗,因為這里任意一串數字子串的左側都不是“Windows ”。

(?!1)/d+”在匹配“123”時,匹配成功,匹配的結果為“23”。“/d+”匹配一個以上數字,但是附加條件“(?!1)”要求所在位置右側不能是“1”,所以匹配成功的位置是“2”前面的位置。

3.5     忽略優先和匹配優先

或者叫做正則表達式匹配的貪婪與非貪婪模式。

標準量詞修飾的子表達式,在可匹配可不匹配的情況下,總會先嘗試進行匹配,稱這種方式為匹配優先,或者貪婪模式。此前介紹的一些量詞,“{m}”、“{m,n}”、“{m,}”、“?”、“*”和“+”都是匹配優先的。

一些NFA正則引擎支持忽略優先量詞,也就是在標準量詞后加一個“?”,此時,在可匹配可不匹配的情況下,總會先忽略匹配,只有在由忽略優先量詞修飾的子表達式,必須進行匹配才能使整個表達式匹配成功時,才會進行匹配,稱這種方式為忽略優先,或者非貪婪模式。忽略優先量詞包括“{m}?”、“{m,n}?”、“{m,}?”、“??”、“*?”和“+?”。

舉例:

源字符串:<div>aaa</div><div>bbb</div>

正則表達式1:<div>.*</div>      匹配結果:<div>aaa</div><div>bbb</div>

正則表達式2:<div>.*?</div>     匹配結果:<div>aaa</div>


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
久久久久久午夜| 九九热精品视频在线播放| 国产精品wwww| 国产精品欧美久久久| 日韩在线一区二区三区免费视频| 国产精品视频男人的天堂| 久久影视电视剧凤归四时歌| 日韩网站免费观看高清| 国产免费观看久久黄| 91精品国产91久久久久久吃药| 成人有码在线视频| 久久91超碰青草是什么| 国产精品白丝jk喷水视频一区| 日韩精品在线视频观看| 国产精品com| 精品亚洲国产视频| 成人免费视频网| 欧美激情在线观看视频| 亚洲成人激情视频| 国产欧美日韩精品丝袜高跟鞋| 色综合91久久精品中文字幕| 91av视频在线观看| 亚洲第一综合天堂另类专| 欧美性猛交xxxx乱大交蜜桃| 26uuu亚洲国产精品| 国产性猛交xxxx免费看久久| 欧美最猛性xxxxx(亚洲精品)| 亚洲天堂影视av| 久久精品国产亚洲精品2020| 亚洲男人天堂2019| 国产欧美一区二区三区在线看| 欧美精品videos另类日本| 日韩欧美中文第一页| 国产美女久久精品| 欧美性资源免费| 欧美黑人狂野猛交老妇| 欧美日韩亚洲视频一区| 欧美专区中文字幕| 久久69精品久久久久久久电影好| 久久国产色av| 欧美国产在线视频| 久久亚洲春色中文字幕| 亚洲tv在线观看| 欧美另类极品videosbestfree| 欧美精品xxx| 中文字幕不卡av| 精品香蕉一区二区三区| 国产精品va在线播放| 奇米4444一区二区三区| 91黑丝高跟在线| 国产91精品高潮白浆喷水| 91国内精品久久| 日韩精品极品在线观看| 国产亚洲人成a一在线v站| 欧美成人免费一级人片100| 尤物yw午夜国产精品视频| 欧美专区第一页| 丝袜美腿精品国产二区| 国产精品人成电影| 欧美老女人bb| 欧美一级免费视频| 91夜夜揉人人捏人人添红杏| 精品色蜜蜜精品视频在线观看| 国产一区二区丝袜高跟鞋图片| 欧美午夜精品在线| 欧美综合激情网| 久久精品最新地址| 国产精品久久久久久网站| 久久久久国色av免费观看性色| 日本不卡高字幕在线2019| 国产精品成人av性教育| 国产精品mp4| 欧美日韩激情美女| 国产成人精品综合久久久| 国产精品久久久久久久av电影| 亚洲成人av在线| 亚洲精品在线观看www| 国产精品久久久久久av福利软件| 欧美日韩视频在线| 国模极品一区二区三区| 久久久视频精品| 亚洲精品国偷自产在线99热| 中文字幕自拍vr一区二区三区| 欧美成人精品影院| 中文字幕欧美精品日韩中文字幕| 亚洲国产精品va| 成人两性免费视频| 裸体女人亚洲精品一区| 欧美色videos| 国产午夜精品一区二区三区| 国内成人精品一区| 91手机视频在线观看| 亚洲国产精品悠悠久久琪琪| 97久久精品国产| 精品久久久久久久久久国产| 亚洲美女喷白浆| 国产一区二区三区在线观看视频| 色综合天天狠天天透天天伊人| 日韩成人高清在线| 国产婷婷成人久久av免费高清| 91免费欧美精品| 欧美裸体男粗大视频在线观看| 91在线观看欧美日韩| 国产福利精品视频| 久久全球大尺度高清视频| 欧美又大又硬又粗bbbbb| 亚洲精品久久久久久久久久久久| 91久久夜色精品国产网站| 57pao精品| 91色中文字幕| 亚洲欧洲xxxx| 成人亚洲欧美一区二区三区| 日韩av免费在线播放| 日韩视频免费看| 国产网站欧美日韩免费精品在线观看| 国产精品久久国产精品99gif| 国产91色在线播放| 久久中文字幕国产| 色哟哟入口国产精品| 在线一区二区日韩| 影音先锋欧美在线资源| 亚洲女人天堂av| 久久久久久久久久久人体| 亚洲国产高清自拍| 日本国产高清不卡| 亚洲欧美制服综合另类| 久久久国产精品一区| 成人激情视频在线| 久久久噜噜噜久久久| 久久国产精品久久精品| xvideos亚洲人网站| 亚洲女同精品视频| 97超级碰碰人国产在线观看| 国产精品444| 日韩av在线直播| 亚洲成人黄色网址| 久久躁狠狠躁夜夜爽| 91精品久久久久久久久| 亚洲成色999久久网站| 亚洲第一国产精品| 亚洲精品一二区| 日韩中文字幕在线播放| 国产91精品青草社区| 91丨九色丨国产在线| 91香蕉嫩草影院入口| 97香蕉超级碰碰久久免费软件| 91精品国产综合久久久久久久久| 久久精品电影一区二区| 亚洲人成在线免费观看| 国产精品久久av| 国产精品69久久久久| 91精品国产综合久久香蕉的用户体验| 亚洲欧洲在线免费| 欧美重口另类videos人妖| 日韩成人av在线播放| 亚洲欧美制服另类日韩| 国产精品亚洲片夜色在线| 亚洲肉体裸体xxxx137| 久久韩国免费视频| 午夜精品美女自拍福到在线| 美女av一区二区三区| 日韩麻豆第一页| 欧美日韩成人网| 社区色欧美激情 |