正則表達式是一種描述字符串結果的語法規則,是一個特定的格式化模式,可以匹配、替換、截取匹配的字符串。常用的語言基本上都有正則表達式,如JavaScript、java等。其實,只有了解一種語言的正則使用,其他語言的正則使用起來,就相對簡單些。好了,開始寫正則了。
正則表達式在匹配字符串時,遵循以下2個基本原則:
1.最左原則:正則表達式總是從目標字符串的最左側開始,依次匹配,直到匹配到符合表達式要求的部分,或直到匹配目標字符串的結束。
2.最長原則:對于匹配到的目標字符串,正則表達式總是會匹配到符合正則表達式要求的最長的部分;即貪婪模式
那怎么開始呢,首先從分隔符開始寫起,常用包括 / ; #;~,用于表明一串正則的開始。如:‘/a.*a/’。當表達式有過多的轉義字符時,建議優先使用#,如url;
$str = 'http://baidu.com';$pattern = '/http:////.*com/';//需要轉義/preg_match($pattern,$str,$match);var_dump( $match);
$str = 'http://baidu.com';$pattern = '#http://.*com#';//不需要轉義/preg_match($pattern,$str,$match);var_dump( $match);
知道開始和結尾的寫法了,接下來就是中間的判斷了。正則表達式是自左向右的順序使用原子和元字符進行拼接。比如'<b>zxcv</b>',進行匹配時,‘/<b>.*<//b>/’,其中.*代表zxcv 。那么通用原子和元字符有哪些呢?
? /d匹配一個數字字符。等價于 [0-9]。
? /D匹配一個非數字字符。等價于 [^0-9]。
? /f匹配一個換頁符。等價于 /x0c 和 /cL。
? /n匹配一個換行符。等價于 /x0a 和 /cJ。
? /r匹配一個回車符。等價于 /x0d 和 /cM。
? /s匹配任何空白字符,包括空格、制表符、換頁符等等。等價于 [ /f/n/r/t/v]。
? /S匹配任何非空白字符。等價于 [^ /f/n/r/t/v]。
? /t匹配一個制表符。等價于 /x09 和 /cI。
? /v匹配一個垂直制表符。等價于 /x0b 和 /cK。
? /w匹配包括下劃線的任何單詞字符。等價于’[A-Za-z0-9_]’。
? /W匹配任何非單詞字符。等價于 ‘[^A-Za-z0-9_]’。
? /xn匹配 n,其中 n 為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。例如,’/x41’ 匹配 “A”?!?x041’ 則等價于 ‘/x04’ & “1”。正則表達式中可以使用 ASCII 編碼。
? /nm標識一個八進制轉義值或一個向后引用。如果 /nm 之前至少有 nm 個獲得子表達式,則 nm 為向后引用。如果 /nm 之前至少有 n 個獲取,則 n 為一個后跟文字 m 的向后引用。如果前面的條件都不滿足,若 n 和 m 均為八進制數字 (0-7),則 ? /nm 將匹配八進制轉義值 nm。
? /nml如果 n 為八進制數字 (0-3),且 m 和 l 均為八進制數字 (0-7),則匹配八進制轉義值 nml。
? /un十六進制數字表示的 Unicode 字符。例如, /u00A9 匹配版權符號(?)。
? . 匹配除 “/n” 之外的任何單個字符
? ^ 匹配輸入字符串的開始位置。在字符域[]中表示取反,如'[^/w]'等于'/w';而^/w表示以單詞字符開頭。
? $ 匹配輸入字符串的結束位置。例'/w$'表示以單詞字符結尾。
? ? 匹配前面的子表達式零次或一次 等價于 {0,1},例如,"do(es)?" 可以匹配 "do" 或 "does"。
? * 匹配前面的子表達式零次或多次,等價于{0,}。例如,zo* 能匹配 "z" 、 "zo"、'zoo'。
? + 匹配前面的子表達式一次或多次,等價于{1,}例如,'zo+' 能匹配 "zo" 以及 "zoo"。
? {n} n 為非負整數,匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 或‘Booob’,但是能匹配 "food" 中的兩個 o。
? {n,} n 為非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價于 'o+'。'o{0,}' 則等價于 'o*'。
? {n,m} m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價于 'o?'。請注意在逗號和兩個數之間不能有空格。
? [] 字符集合(字符域)。匹配所包含的任意一個字符。例如, '[abc]' 可以匹配 "plain" 中的 'a'。
? () 匹配 ()內的內容 并獲取這一匹配。搭配/n(n為大于1的整數),‘http://baidu.com’若表達式:‘(/w+) (:)////.*/1’則匹配‘http://baidu.comhttp’,/1表示http。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。
新聞熱點
疑難解答