亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > regex > 正文

小議正則表達式效率 貪婪、非貪婪與回溯

2020-01-20 22:17:18
字體:
來源:轉載
供稿:網友
先掃盲一下什么是正則表達式的貪婪,什么是非貪婪?或者說什么是匹配優先量詞,什么是忽略優先量詞?
好吧,我也不知道概念是什么,來舉個例子吧。
某同學想過濾之間的內容,那是這么寫正則以及程序的。
復制代碼 代碼如下:

$str = preg_replace('%<script>.+?</script>%i','',$str);//非貪婪

看起來,好像沒什么問題,其實則不然。若
復制代碼 代碼如下:

$str = '<script<script>alert(document.cookie)</script>>alert(document.cookie)</script>';

那么經過上面的程序處理,其結果為
復制代碼 代碼如下:

$str = '<script<script>alert(document.cookie)</script>>alert(document.cookie)</script>';
$str = preg_replace('%<script>.+?</script>%i','',$str);//非貪婪
print_r($str);
//$str 輸出為 <script>alert(document.cookie)</script>

仍然達不到他想要的效果。上面的就是非貪婪,也有的叫惰性。其標志非貪婪的標識為量數元字符后面加? ,比如 +?、*?、??(比較特殊,以后的BLOG中,我會寫到)等。即標識非貪婪,如果不寫?就是貪婪。比如
復制代碼 代碼如下:

$str = '<script<script>alert(document.cookie)</script>>alert(document.cookie)</script>';
$str = preg_replace('%<script>.+</script>%i','',$str);//非貪婪
print_r($str);
//$str 輸出為 <script 只有這些了,好像還是不太合適,哈,您知道如何重寫那個正則嗎?

以上為貪婪,非貪婪的區別介紹。下面,聊下貪婪、非貪婪引起的回溯問題。先看個小例子。
正則表達式為/w*(/d+),字符串為cfc456n,那么,這個正則匹配的$1是多少??

如果您回答是 456,那么,恭喜你,回答錯了,其結果不是456,而是6,您知道為什么嗎?

CFC4N來解釋一下,當正則引擎用正則/w*(/d+)去匹配字符串cfc456n時,會先用/w*去匹配字符串cfc456n,首先,/w*會匹配字符串cfc456n的所有字符,然后再交給/d+去匹配剩下的字符串,而剩下的沒了,這時,/w*規則會不情愿的吐出一個字符,給/d+去匹配,同時,在吐出字符之前,記錄一個點,這個點,就是用于回溯的點,然后/d+去匹配n,發現并不能匹配成功,會再次要求/w*再吐出一個字符,/w*會先再次記錄一個回溯的點,再吐出一個字符。這時,/w* 匹配的結果只有cfc45了,已經吐出6n了,/d+再去匹配6,發現匹配成功,則會通知引擎,匹配成功了,就直接顯示出來了。所以,(/d+)的結果是6,而不是456。

當上面的正則表達式改為 /w*?(/d+)(注意,此處為非貪婪),字符串仍然為cfc456n,那么,這時候,正則匹配的$1是多少??
甲同學回答:結果是 456。
嗯,是的,正確,是456,CFC4N弱弱的問下,為什么是456 呢?
我在來解釋一下 為什么是456
正則表達式有條規則,是量詞優先匹配,所以/w*?會先去匹配字符串cfc456,由于/w*?是非貪婪,正則引擎會用表達式/w+?每次僅匹配一個字符串,然后再將控制權交給后面的/d+去匹配下一個字符,同時,記錄一個點,用于在匹配不成功的時候,返回這里,再次匹配,也就是回溯點。由于/w后面是量詞是*,*表示0到無數次,所以,首先是0次,也就是/w*?匹配個空,記錄回溯點,將控制權交給/d+,/d+去匹配cfc456n的第一個字符c,然后,匹配失敗,于是乎,接著講控制權交給/w*?去匹配cfc456n的c,/w*?匹配c成功,由于是非貪婪,所以,他每次只匹配一個字符,記錄回溯點,然后再將控制權交給/d+匹配f,接著,/d+匹配f再失敗,再把控制權給/w*?,/w*?再匹配c,記錄回溯點(這時/w*?匹配結果是cfc了),再把控制權給/d+,/d+去匹配4,匹配成功,然后,由于量詞是+,就是1到無數次,所以,接著往后匹配,再匹配5,成功,再接著,再匹配6,成功,再接著,繼續匹配操作,下一個字符是n,匹配失敗,這時,/d+會吧控制權交出去。由于/d+后面已經沒有正則表達式了,所以,整個正則表達式宣告匹配完成,其結果就是 cfc456, 其中第一組結果是456。親愛的同學,您明白剛剛的題目的結果,為什么是456了嗎?

好了,您是否從上面的例子了解了貪婪,非貪婪的匹配原理了?那您是否明白您在什么時候需要使用貪婪,非貪婪去處理您的字符串了?
鳥哥的文章里講到針對
表達式、程序為
復制代碼 代碼如下:

$reg = "/<script>.*?<//script>/is";
$str = "<script>********</script>"; //長度大于100014
$ret = preg_repalce($reg, "", $str); //返回NULL

其原因就是回溯太多了,直到造成耗盡??臻g爆棧。

再來看個例子。
字符串
復制代碼 代碼如下:

$str = '<script>123456</script>';

正則表達式為
復制代碼 代碼如下:

$strRegex1 = '%<script>.+<//script>%';
$strRegex2 = '%<script>.+?<//script>%';
$strRegex3 = '%<script>(?:(?!<//script>).)+<//script>%';

這三個正則,分別會造成幾次回溯呢??

答案見下篇 PHP正則表達式的效率:回溯與固化分組
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
亚洲国产精品久久久久秋霞不卡| 亚洲男人天堂久| 日韩中文字幕不卡视频| 国产福利成人在线| 色99之美女主播在线视频| 亚洲专区中文字幕| 国产成人鲁鲁免费视频a| 欧美国产日韩一区| 欧美激情精品久久久| 欧美激情精品久久久久久黑人| 中文字幕亚洲欧美| 亚洲国产三级网| 成人网在线免费看| 91av在线影院| 久久久99免费视频| 亚洲精品久久久久久久久久久久久| 超碰精品一区二区三区乱码| 性欧美xxxx| 日韩免费中文字幕| 国产成人极品视频| 色中色综合影院手机版在线观看| 中文字幕免费精品一区高清| 日韩第一页在线| 最近2019年日本中文免费字幕| 日韩一区二区久久久| 91精品久久久久久久久久久久久久| 亚洲美女性视频| 欧美视频第一页| 国产脚交av在线一区二区| 日韩性xxxx爱| 色综合久久88色综合天天看泰| 久久色精品视频| 日韩电影中文字幕在线| 亚洲一区二区三区xxx视频| 日本韩国欧美精品大片卡二| 2024亚洲男人天堂| 91精品久久久久久久久久久| 国产成人精品视频在线观看| 欧美xxxx14xxxxx性爽| 成人免费视频在线观看超级碰| 日韩中文在线不卡| 色哟哟入口国产精品| 欧美日韩第一视频| 亚洲乱亚洲乱妇无码| 国产亚洲综合久久| 日韩av免费一区| 日韩在线观看成人| 这里只有精品丝袜| 国产高清视频一区三区| 亚洲色图欧美制服丝袜另类第一页| 伊人伊人伊人久久| 久久久视频精品| 国产精品自产拍在线观看中文| 亚洲欧美激情另类校园| 亚洲国产成人精品久久| 中文字幕精品在线视频| 日韩少妇与小伙激情| 成人高h视频在线| 亚洲xxxx在线| 亚洲天堂av在线免费| 伊人久久男人天堂| 日韩在线精品一区| 伊人伊成久久人综合网站| 中文字幕综合在线| 日韩欧美成人精品| 91在线高清免费观看| 欧美高清视频在线| 欧美精品电影免费在线观看| 日本成熟性欧美| 日韩一中文字幕| 97国产真实伦对白精彩视频8| 欧美激情一区二区三区高清视频| 91久久国产精品91久久性色| 国产精品91久久久久久| 懂色av中文一区二区三区天美| 国产第一区电影| 欧美性开放视频| 欧美激情国产日韩精品一区18| 丁香五六月婷婷久久激情| 日韩国产精品视频| 97色伦亚洲国产| 精品人伦一区二区三区蜜桃免费| 欧美日韩国产丝袜另类| 亚洲春色另类小说| 国产精品成人播放| 97色在线视频观看| 亚洲欧美国产另类| 成人午夜激情免费视频| 中文字幕日韩av电影| 久久香蕉频线观| 成人免费观看49www在线观看| 色综合久久悠悠| 亚洲精品xxx| 国产一区二区三区中文| 亚洲国产精品一区二区三区| 亚洲国产日韩欧美在线图片| 一区二区三区回区在观看免费视频| 欧美激情精品久久久久| 精品一区二区亚洲| 91精品视频免费观看| 欧美日产国产成人免费图片| 97国产精品人人爽人人做| 国产精品美女免费视频| 久久久精品视频在线观看| 成人妇女淫片aaaa视频| 性视频1819p久久| 国产激情综合五月久久| 欧美专区国产专区| 亚洲欧洲日产国产网站| 韩剧1988在线观看免费完整版| 欧美大全免费观看电视剧大泉洋| 国产成人黄色av| 一区二区三区无码高清视频| 欧美性猛交xxxx乱大交极品| 岛国av一区二区在线在线观看| 日韩精品中文字幕在线| 日韩国产精品亚洲а∨天堂免| 欧美一区二区三区四区在线| 91精品国产自产91精品| 亚洲视频电影图片偷拍一区| 亚洲 日韩 国产第一| 久久综合伊人77777尤物| 中文字幕精品在线视频| 亚洲xxxx做受欧美| 亚洲综合精品一区二区| 亚洲国产精品成人va在线观看| 国产精品一香蕉国产线看观看| 国产精品av在线| 精品国产乱码久久久久酒店| 亚洲网在线观看| 不卡在线观看电视剧完整版| www.精品av.com| 日日摸夜夜添一区| 米奇精品一区二区三区在线观看| 亚洲aaaaaa| 日韩精品免费电影| 亚洲福利小视频| 国产精品久久久久久久美男| 欧美日韩国产在线播放| 中国china体内裑精亚洲片| 中文字幕亚洲字幕| 亚洲国产成人精品女人久久久| 亚洲va欧美va国产综合久久| 精品久久久视频| 欧美国产极速在线| 91欧美精品午夜性色福利在线| 欧美日韩国产中文精品字幕自在自线| 欧美在线视频免费| 欧美日韩亚洲激情| 亚洲第一精品自拍| 91午夜在线播放| 久久精品免费播放| 中文字幕日韩视频| 9.1国产丝袜在线观看| 国产精品99导航| 欧美亚洲一区在线| 欧美亚洲伦理www| 在线播放国产一区二区三区| 亚洲综合色av| 日韩美女免费观看| 久久香蕉国产线看观看av| 国产人妖伪娘一区91| 亚洲欧美中文日韩在线v日本| 国产成人精品av在线|