亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > regex > 正文

正則表達式學習筆記

2020-01-20 22:29:03
字體:
來源:轉載
供稿:網友
正則表達式學習筆記
  正則表達式(regular expression)描述了一種字符串匹配的模式,可以用來檢查一個串是否含 
有某種子串、將匹配的子串做替換或者從某個串中取出符合某個條件的子串等。
  列目錄時, dir *.txt或ls *.txt中的*.txt就不是一個正則表達式,因為這里*與正則式的* 
的含義是不同的。
  為便于理解和記憶,先從一些概念入手,所有特殊字符或字符組合有一個總表在后面,最后一 
些例子供理解相應的概念。
正則表達式
  是由普通字符(例如字符 a 到 z)以及特殊字符(稱為元字符)組成的文字模式。正則表達 
式作為一個模板,將某個字符模式與所搜索的字符串進行匹配。
  可以通過在一對分隔符之間放入表達式模式的各種組件來構造一個正則表達式, 
即/expression/
普通字符
  由所有那些未顯式指定為元字符的打印和非打印字符組成。這包括所有的大寫和小寫字母字符 
,所有數字,所有標點符號以及一些符號。 
非打印字符
字符  含義 
/cx  匹配由x指明的控制字符。例如, /cM 匹配一個 Control-M 或回車符。x 的值必須為 A-Z  
或 a-z 之一。否則,將 c 視為一個原義的 'c' 字符。 
/f  匹配一個換頁符。等價于 /x0c 和 /cL。 
/n  匹配一個換行符。等價于 /x0a 和 /cJ。 
/r  匹配一個回車符。等價于 /x0d 和 /cM。 
/s  匹配任何空白字符,包括空格、制表符、換頁符等等。等價于 [ /f/n/r/t/v]。 
/S  匹配任何非空白字符。等價于 [^ /f/n/r/t/v]。 
/t  匹配一個制表符。等價于 /x09 和 /cI。 
/v  匹配一個垂直制表符。等價于 /x0b 和 /cK。 
特殊字符
  所謂特殊字符,就是一些有特殊含義的字符,如上面說的"*.txt"中的*,簡單的說就是表示任 
何字符串的意思。如果要查找文件名中有*的文件,則需要對*進行轉義,即在其前加一個/。ls  
/*.txt。正則表達式有以下特殊字符。
特別字符 說明 
$ 匹配輸入字符串的結尾位置。如果設置了 RegExp 對象的 Multiline 屬性,則 $ 也匹配 '/n'  
或 '/r'。要匹配 $ 字符本身,請使用 /$。 
( ) 標記一個子表達式的開始和結束位置。子表達式可以獲取供以后使用。要匹配這些字符,請使 
用 /( 和 /)。 
* 匹配前面的子表達式零次或多次。要匹配 * 字符,請使用 /*。 
+ 匹配前面的子表達式一次或多次。要匹配 + 字符,請使用 /+。 
. 匹配除換行符 /n之外的任何單字符。要匹配 .,請使用 /。 
[  標記一個中括號表達式的開始。要匹配 [,請使用 /[。 
? 匹配前面的子表達式零次或一次,或指明一個非貪婪限定符。要匹配 ? 字符,請使用 /?。 
/ 將下一個字符標記為或特殊字符、或原義字符、或向后引用、或八進制轉義符。例如, 'n' 匹 
配字符 'n'。'/n' 匹配換行符。序列 '//' 匹配 "/",而 '/(' 則匹配 "("。 
^ 匹配輸入字符串的開始位置,除非在方括號表達式中使用,此時它表示不接受該字符集合。要匹 
配 ^ 字符本身,請使用 /^。 
{ 標記限定符表達式的開始。要匹配 {,請使用 /{。 
| 指明兩項之間的一個選擇。要匹配 |,請使用 /|。 
  構造正則表達式的方法和創建數學表達式的方法一樣。也就是用多種元字符與操作符將小的表 
達式結合在一起來創建更大的表達式。正則表達式的組件可以是單個的字符、字符集合、字符范圍 
、字符間的選擇或者所有這些組件的任意組合。
限定符
  限定符用來指定正則表達式的一個給定組件必須要出現多少次才能滿足匹配。有*或+或?或{n} 
或{n,}或{n,m}共6種。
*、+和?限定符都是貪婪的,因為它們會盡可能多的匹配文字,只有在它們的后面加上一個?就可以 
實現非貪婪或最小匹配
  正則表達式的限定符有:
字符  描述 
*  匹配前面的子表達式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等價于{0,}。 
+  匹配前面的子表達式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+  
等價于 {1,}。 
?  匹配前面的子表達式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。?  
等價于 {0,1}。 
{n}  n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹 
配 "food" 中的兩個 o。 
{n,}  n 是一個非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配  
"foooood" 中的所有 o。'o{1,}' 等價于 'o+'。'o{0,}' 則等價于 'o*'。 
{n,m}  m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}"  
將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價于 'o?'。請注意在逗號和兩個數之間不能有空 
格。 
定位符
  用來描述字符串或單詞的邊界,^和$分別指字符串的開始與結束,/b描述單詞的前或后邊界, 
/B表示非單詞邊界。不能對定位符使用限定符。
選擇
  用圓括號將所有選擇項括起來,相鄰的選擇項之間用|分隔。但用圓括號會有一個副作用,是 
相關的匹配會被緩存,此時可用?:放在第一個選項前來消除這種副作用。
  其中?:是非捕獲元之一,還有兩個非捕獲元是?=和?!,這兩個還有更多的含義,前者為正向預 
查,在任何開始匹配圓括號內的正則表達式模式的位置來匹配搜索字符串,后者為負向預查,在任 
何開始不匹配該正則表達式模式的位置來匹配搜索字符串。
后向引用
  對一個正則表達式模式或部分模式兩邊添加圓括號將導致相關匹配存儲到一個臨時緩沖區中, 
所捕獲的每個子匹配都按照在正則表達式模式中從左至右所遇到的內容存儲。存儲子匹配的緩沖區 
編號從 1 開始,連續編號直至最大 99 個子表達式。每個緩沖區都可以使用 '/n' 訪問,其中 n  
為一個標識特定緩沖區的一位或兩位十進制數。
  可以使用非捕獲元字符 '?:', '?=', or '?!' 來忽略對相關匹配的保存。
各種操作符的運算優先級
  相同優先級的從左到右進行運算,不同優先級的運算先高后低。各種操作符的優先級從高到低 
如下:
操作符  描述 
/  轉義符 
(), (?:), (?=), []  圓括號和方括號 
*, +, ?, {n}, {n,}, {n,m}  限定符 
^, $, /anymetacharacter  位置和順序 
|  “或”操作 
全部符號解釋
字符  描述 
/  將下一個字符標記為一個特殊字符、或一個原義字符、或一個 向后引用、或一個八進制轉義符 
。例如,'n' 匹配字符 "n"。'/n' 匹配一個換行符。序列 '//' 匹配 "/" 而 "/(" 則匹配 "("。 
^  匹配輸入字符串的開始位置。如果設置了 RegExp 對象的 Multiline 屬性,^ 也匹配 '/n' 或  
'/r' 之后的位置。 
$  匹配輸入字符串的結束位置。如果設置了RegExp 對象的 Multiline 屬性,$ 也匹配 '/n' 或  
'/r' 之前的位置。 
*  匹配前面的子表達式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等價于{0,}。 
+  匹配前面的子表達式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+  
等價于 {1,}。 
?  匹配前面的子表達式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。?  
等價于 {0,1}。 
{n}  n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹 
配 "food" 中的兩個 o。 
{n,}  n 是一個非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配  
"foooood" 中的所有 o。'o{1,}' 等價于 'o+'。'o{0,}' 則等價于 'o*'。 
{n,m}  m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}"  
將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價于 'o?'。請注意在逗號和兩個數之間不能有空 
格。 
?  當該字符緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面時,匹配模式是非貪 
婪的。非貪婪模式盡可能少的匹配所搜索的字符串,而默認的貪婪模式則盡可能多的匹配所搜索的 
字符串。例如,對于字符串 "oooo",'o+?' 將匹配單個 "o",而 'o+' 將匹配所有 'o'。 
.  匹配除 "/n" 之外的任何單個字符。要匹配包括 '/n' 在內的任何字符,請使用象 '[./n]' 的 
模式。 
(pattern)  匹配 pattern 并獲取這一匹配。所獲取的匹配可以從產生的 Matches 集合得到,在 
VBScript 中使用 SubMatches 集合,在JScript 中則使用 $0…$9 屬性。要匹配圓括號字符,請 
使用 '/(' 或 '/)'。 
(?:pattern)  匹配 pattern 但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲供以 
后使用。這在使用 "或" 字符 (|) 來組合一個模式的各個部分是很有用。例如, 'industr 
(?:y|ies) 就是一個比 'industry|industries' 更簡略的表達式。 
(?=pattern)  正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取 
匹配,也就是說,該匹配不需要獲取供以后使用。例如,'Windows (?=95|98|NT|2000)' 能匹配  
"Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"。預查不消耗字 
符,也就是說,在一個匹配發生后,在最后一次匹配之后立即開始下一次匹配的搜索,而不是從包 
含預查的字符之后開始。 
(?!pattern)  負向預查,在任何不匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲 
取匹配,也就是說,該匹配不需要獲取供以后使用。例如'Windows (?!95|98|NT|2000)' 能匹配  
"Windows 3.1" 中的 "Windows",但不能匹配 "Windows 2000" 中的 "Windows"。預查不消耗字符 
,也就是說,在一個匹配發生后,在最后一次匹配之后立即開始下一次匹配的搜索,而不是從包含 
預查的字符之后開始 
x|y  匹配 x 或 y。例如,'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 則匹配 "zood" 或  
"food"。 
[xyz]  字符集合。匹配所包含的任意一個字符。例如, '[abc]' 可以匹配 "plain" 中的 'a'。 
[^xyz]  負值字符集合。匹配未包含的任意字符。例如, '[^abc]' 可以匹配 "plain" 中的'p'。 
[a-z]  字符范圍。匹配指定范圍內的任意字符。例如,'[a-z]' 可以匹配 'a' 到 'z' 范圍內的 
任意小寫字母字符。 
[^a-z]  負值字符范圍。匹配任何不在指定范圍內的任意字符。例如,'[^a-z]' 可以匹配任何不 
在 'a' 到 'z' 范圍內的任意字符。 
/b  匹配一個單詞邊界,也就是指單詞和空格間的位置。例如, 'er/b' 可以匹配"never" 中的  
'er',但不能匹配 "verb" 中的 'er'。 
/B  匹配非單詞邊界。'er/B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。 
/cx  匹配由 x 指明的控制字符。例如, /cM 匹配一個 Control-M 或回車符。x 的值必須為 A-Z  
或 a-z 之一。否則,將 c 視為一個原義的 'c' 字符。 
/d  匹配一個數字字符。等價于 [0-9]。 
/D  匹配一個非數字字符。等價于 [^0-9]。 
/f  匹配一個換頁符。等價于 /x0c 和 /cL。 
/n  匹配一個換行符。等價于 /x0a 和 /cJ。 
/r  匹配一個回車符。等價于 /x0d 和 /cM。 
/s  匹配任何空白字符,包括空格、制表符、換頁符等等。等價于 [ /f/n/r/t/v]。 
/S  匹配任何非空白字符。等價于 [^ /f/n/r/t/v]。 
/t  匹配一個制表符。等價于 /x09 和 /cI。 
/v  匹配一個垂直制表符。等價于 /x0b 和 /cK。 
/w  匹配包括下劃線的任何單詞字符。等價于'[A-Za-z0-9_]'。 
/W  匹配任何非單詞字符。等價于 '[^A-Za-z0-9_]'。 
/xn  匹配 n,其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。例 
如,'/x41' 匹配 "A"。'/x041' 則等價于 '/x04' & "1"。正則表達式中可以使用 ASCII 編碼。. 
/num  匹配 num,其中 num 是一個正整數。對所獲取的匹配的引用。例如,'(.)/1' 匹配兩個連 
續的相同字符。 
/n  標識一個八進制轉義值或一個向后引用。如果 /n 之前至少 n 個獲取的子表達式,則 n 為向 
后引用。否則,如果 n 為八進制數字 (0-7),則 n 為一個八進制轉義值。 
/nm  標識一個八進制轉義值或一個向后引用。如果 /nm 之前至少有 nm 個獲得子表達式,則 nm  
為向后引用。如果 /nm 之前至少有 n 個獲取,則 n 為一個后跟文字 m 的向后引用。如果前面的 
條件都不滿足,若 n 和 m 均為八進制數字 (0-7),則 /nm 將匹配八進制轉義值 nm。 
/nml  如果 n 為八進制數字 (0-3),且 m 和 l 均為八進制數字 (0-7),則匹配八進制轉義值  
nml。 
/un  匹配 n,其中 n 是一個用四個十六進制數字表示的 Unicode 字符。例如, /u00A9 匹配版 
權符號 (?)。 
部分例子
正則表達式 說明 
//b([a-z]+) /1/b/gi 一個單詞連續出現的位置 
/(/w+):////([^/:]+)(:/d*)?([^# ]*)/  將一個URL解析為協議、域、端口及相對路徑 
/^(?:Chapter|Section) [1-9][0-9]{0,1}$/ 定位章節的位置 
/[-a-z]/ A至z共26個字母再加一個-號。 
/ter/b/ 可匹配chapter,而不能terminal 
//Bapt/ 可匹配chapter,而不能aptitude 
/Windows(?=95 |98 |NT )/ 可匹配Windows95或Windows98或WindowsNT,當找到一個匹配后,從 
Windows后面開始進行下一次的檢索匹配。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
国产精品午夜视频| 国产精品一区二区三区久久| 国产精品美乳一区二区免费| 92福利视频午夜1000合集在线观看| 精品日韩视频在线观看| 久久男人资源视频| 精品国产一区二区三区久久久| 91久久久国产精品| 精品国内自产拍在线观看| 国产午夜精品麻豆| 久久久久久久久中文字幕| 国产香蕉精品视频一区二区三区| 日韩大陆欧美高清视频区| 在线视频欧美性高潮| 欧美夜福利tv在线| 91精品久久久久久久久久久久久久| 4438全国亚洲精品在线观看视频| 97在线视频免费观看| 久久精品免费播放| 91精品国产亚洲| 欧美激情成人在线视频| 国精产品一区一区三区有限在线| 色七七影院综合| 亚洲第一视频在线观看| 中文字幕日韩av综合精品| 美日韩丰满少妇在线观看| 亚洲精品之草原avav久久| 国产精品免费在线免费| 57pao精品| 国产精品久久久久久久久久久久久久| 欧美精品久久久久久久免费观看| 97免费中文视频在线观看| 欧美xxxx做受欧美| 98精品在线视频| 日韩在线观看免费全| 亚洲欧美激情四射在线日| 亚洲精品国产欧美| 日韩经典一区二区三区| 在线中文字幕日韩| 欧美电影免费观看| 91高清视频在线免费观看| 欧美激情小视频| 精品久久久久久国产| 精品亚洲一区二区三区在线播放| 国产美女久久精品香蕉69| 日韩欧美在线视频观看| 欧美成人精品影院| 欧美电影电视剧在线观看| 国产精品久久久亚洲| 91精品国产91久久久久久| 久久久av免费| 8050国产精品久久久久久| 精品国产欧美一区二区三区成人| 国产精品毛片a∨一区二区三区|国| 久久九九亚洲综合| 日韩中文视频免费在线观看| 亚洲精品成人久久| 亚洲精品久久7777777| 成人美女av在线直播| 中文字幕亚洲一区二区三区| 一区二区亚洲欧洲国产日韩| 久久人人爽人人爽人人片av高请| 欧美色播在线播放| 韩国福利视频一区| 中文字幕亚洲一区| 国产一区二区三区视频免费| 91精品国产高清| 91理论片午午论夜理片久久| 国产精品69精品一区二区三区| 国产成人精品免费视频| 97超碰国产精品女人人人爽| 97久久伊人激情网| 97国产真实伦对白精彩视频8| 成人在线激情视频| 成人有码视频在线播放| 亚洲人成在线播放| 欧美另类69精品久久久久9999| 日本一区二区三区在线播放| 久久精品国产精品| 亚洲精品视频免费| 日韩欧美一区视频| 97久久精品视频| 色偷偷亚洲男人天堂| 91网站在线免费观看| 亚洲丁香久久久| 国产精品444| 日韩有码片在线观看| 亚洲精品一区二三区不卡| 大胆人体色综合| 国产69精品久久久久99| 国产亚洲aⅴaaaaaa毛片| 亚洲毛茸茸少妇高潮呻吟| 成人黄在线观看| 国产有码一区二区| 日韩久久精品成人| 欧美性猛交xxxx黑人| 亚洲欧洲中文天堂| 91视频-88av| 欧洲成人性视频| 美女久久久久久久久久久| 色青青草原桃花久久综合| 日韩电视剧在线观看免费网站| 久久精品99久久香蕉国产色戒| 色偷偷91综合久久噜噜| 亚洲国产精品嫩草影院久久| 成人妇女免费播放久久久| 日韩美女在线看| 国产精品三级久久久久久电影| 中文字幕视频一区二区在线有码| 中文字幕日韩高清| 91精品国产综合久久久久久蜜臀| 亚洲第一偷拍网| 色视频www在线播放国产成人| 亚洲国产美女久久久久| 日韩免费av片在线观看| 亚洲va码欧洲m码| 日韩在线一区二区三区免费视频| 美乳少妇欧美精品| 亚洲成人久久网| 久久综合亚洲社区| 97视频免费在线看| 亚洲最大的成人网| 久久精品免费电影| 91精品国产色综合| 久久婷婷国产麻豆91天堂| 国产一区二区美女视频| 亚洲国产精品久久| 日韩精品高清在线| 国产亚洲精品成人av久久ww| 97激碰免费视频| 热久久视久久精品18亚洲精品| 国产精品免费一区| 国产成人精品综合久久久| 日韩国产欧美区| 国产精品视频最多的网站| 国产日本欧美在线观看| 91超碰中文字幕久久精品| 日韩性生活视频| 日韩欧美国产中文字幕| 国产一区二区三区18| 国产裸体写真av一区二区| 97在线视频免费观看| 日韩中文字幕视频在线| 91精品国产91| 亚洲国产毛片完整版| 久久精品电影一区二区| 亚洲美女精品久久| 久久精品男人天堂| 亚洲无亚洲人成网站77777| 5566成人精品视频免费| 一本大道亚洲视频| 欧美激情免费视频| 久久久欧美一区二区| 国产日韩精品视频| 国产精品扒开腿做爽爽爽男男| 亚洲a在线播放| 欧美日韩国产精品一区| 国产成人精品久久二区二区91| 国产精品福利在线观看网址| 5252色成人免费视频| 日韩国产中文字幕| 日本久久久a级免费| 欧美肥婆姓交大片| 亚洲一区第一页|