亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Regex > 正文

小議正則表達式效率 貪婪、非貪婪與回溯

2020-03-16 21:12:01
字體:
來源:轉載
供稿:網友
前幾天看了鳥哥的BLOG上寫的關于正則表達式的回溯與遞歸的限制時,對貪婪、非貪婪產生的回溯有疑問,遂近段時間,仔細的學習研究了一下,現在把經驗心得與大家分享一下。
 
 
先掃盲一下什么是正則表達式的貪婪,什么是非貪婪?或者說什么是匹配優先量詞,什么是忽略優先量詞? 
好吧,我也不知道概念是什么,來舉個例子吧。 
某同學想過濾之間的內容,那是這么寫正則以及程序的。 
復制代碼代碼如下:

$str = preg_replace('%<script>.+?</script>%i','',$str);//非貪婪 

看起來,好像沒什么問題,其實則不然。若 
復制代碼代碼如下:

$str = '<script<script>alert(document.cookie)</script>>alert(document.cookie)</script>'; 

那么經過上面的程序處理,其結果為 
復制代碼代碼如下:

$str = '<script<script>alert(document.cookie)</script>>alert(document.cookie)</script>'; 
$str = preg_replace('%<script>.+?</script>%i','',$str);//非貪婪 
print_r($str); 
//$str 輸出為 <script>alert(document.cookie)</script> 

仍然達不到他想要的效果。上面的就是非貪婪,也有的叫惰性。其標志非貪婪的標識為量數元字符后面加? ,比如 +?、*?、??(比較特殊,以后的BLOG中,我會寫到)等。即標識非貪婪,如果不寫?就是貪婪。比如 
復制代碼代碼如下:

$str = '<script<script>alert(document.cookie)</script>>alert(document.cookie)</script>'; 
$str = preg_replace('%<script>.+</script>%i','',$str);//非貪婪 
print_r($str); 
//$str 輸出為 <script 只有這些了,好像還是不太合適,哈,您知道如何重寫那個正則嗎? 

以上為貪婪,非貪婪的區別介紹。下面,聊下貪婪、非貪婪引起的回溯問題。先看個小例子。 
正則表達式為/w*(/d+),字符串為cfc456n,那么,這個正則匹配的$1是多少?? 

如果您回答是 456,那么,恭喜你,回答錯了,其結果不是456,而是6,您知道為什么嗎? 

CFC4N來解釋一下,當正則引擎用正則/w*(/d+)去匹配字符串cfc456n時,會先用/w*去匹配字符串cfc456n,首先,/w*會匹配字符串cfc456n的所有字符,然后再交給/d+去匹配剩下的字符串,而剩下的沒了,這時,/w*規則會不情愿的吐出一個字符,給/d+去匹配,同時,在吐出字符之前,記錄一個點,這個點,就是用于回溯的點,然后/d+去匹配n,發現并不能匹配成功,會再次要求/w*再吐出一個字符,/w*會先再次記錄一個回溯的點,再吐出一個字符。這時,/w* 匹配的結果只有cfc45了,已經吐出6n了,/d+再去匹配6,發現匹配成功,則會通知引擎,匹配成功了,就直接顯示出來了。所以,(/d+)的結果是6,而不是456。 

當上面的正則表達式改為 /w*?(/d+)(注意,此處為非貪婪),字符串仍然為cfc456n,那么,這時候,正則匹配的$1是多少?? 
甲同學回答:結果是 456。 
嗯,是的,正確,是456,CFC4N弱弱的問下,為什么是456 呢? 
我在來解釋一下 為什么是456 
正則表達式有條規則,是量詞優先匹配,所以/w*?會先去匹配字符串cfc456,由于/w*?是非貪婪,正則引擎會用表達式/w+?每次僅匹配一個字符串,然后再將控制權交給后面的/d+去匹配下一個字符,同時,記錄一個點,用于在匹配不成功的時候,返回這里,再次匹配,也就是回溯點。由于/w后面是量詞是*,*表示0到無數次,所以,首先是0次,也就是/w*?匹配個空,記錄回溯點,將控制權交給/d+,/d+去匹配cfc456n的第一個字符c,然后,匹配失敗,于是乎,接著講控制權交給/w*?去匹配cfc456n的c,/w*?匹配c成功,由于是非貪婪,所以,他每次只匹配一個字符,記錄回溯點,然后再將控制權交給/d+匹配f,接著,/d+匹配f再失敗,再把控制權給/w*?,/w*?再匹配c,記錄回溯點(這時/w*?匹配結果是cfc了),再把控制權給/d+,/d+去匹配4,匹配成功,然后,由于量詞是+,就是1到無數次,所以,接著往后匹配,再匹配5,成功,再接著,再匹配6,成功,再接著,繼續匹配操作,下一個字符是n,匹配失敗,這時,/d+會吧控制權交出去。由于/d+后面已經沒有正則表達式了,所以,整個正則表達式宣告匹配完成,其結果就是 cfc456, 其中第一組結果是456。親愛的同學,您明白剛剛的題目的結果,為什么是456了嗎? 

好了,您是否從上面的例子了解了貪婪,非貪婪的匹配原理了?那您是否明白您在什么時候需要使用貪婪,非貪婪去處理您的字符串了? 
鳥哥的文章里講到針對 
表達式、程序為 
復制代碼代碼如下:

$reg = "/<script>.*?<//script>/is"; 
$str = "<script>********</script>"; //長度大于100014 
$ret = preg_repalce($reg, "", $str); //返回NULL 

其原因就是回溯太多了,直到造成耗盡??臻g爆棧。 

再來看個例子。 
字符串 
復制代碼代碼如下:

$str = '<script>123456</script>'; 

正則表達式為 
復制代碼代碼如下:

$strRegex1 = '%<script>.+<//script>%'; 
$strRegex2 = '%<script>.+?<//script>%'; 
$strRegex3 = '%<script>(?:(?!<//script>).)+<//script>%'; 

這三個正則,分別會造成幾次回溯呢?? 

答案見下篇 PHP正則表達式的效率:回溯與固化分組

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
色哟哟入口国产精品| 欧美日韩在线观看视频| 欧美韩日一区二区| 国产91在线高潮白浆在线观看| 亚洲级视频在线观看免费1级| 亚洲福利在线播放| 国产日韩在线亚洲字幕中文| 久久精品久久久久久国产 免费| 久久久之久亚州精品露出| 亚洲一区二区三区久久| 久久久成人av| 亚洲石原莉奈一区二区在线观看| 欧美日韩免费在线观看| 久久影视电视剧免费网站| 亚洲激情在线观看| 日韩福利视频在线观看| 亚洲一区二区免费| 日韩亚洲欧美中文在线| 日韩av影视综合网| 中日韩美女免费视频网址在线观看| 国产精品视频免费在线| 国内免费久久久久久久久久久| 亚洲精品suv精品一区二区| 韩国美女主播一区| 久久久国产精彩视频美女艺术照福利| 91精品国产乱码久久久久久久久| 亚洲精品国产精品国产自| 午夜精品久久久久久久99热浪潮| 国产乱肥老妇国产一区二| 97在线观看视频| 亚洲欧美日韩国产成人| 国产美女高潮久久白浆| 欧美精品一区二区免费| 911国产网站尤物在线观看| 91久久精品国产| 欧美成人免费小视频| 日韩亚洲国产中文字幕| 亚洲第一黄色网| 91精品国产91| 亚洲国产精品福利| 国产精品三级美女白浆呻吟| 日韩av在线网站| 欧美日产国产成人免费图片| 91在线观看免费高清完整版在线观看| 欧美疯狂性受xxxxx另类| 亚洲高清一二三区| 欧美成人全部免费| 欧美激情精品久久久久久蜜臀| 成人天堂噜噜噜| 26uuu国产精品视频| 国产视频亚洲精品| 成人国产在线激情| 国产一区二区三区欧美| 久久久亚洲精品视频| 欧美大肥婆大肥bbbbb| 亚洲毛片在线免费观看| 亚洲三级av在线| 亚洲成人精品av| 亚洲国产成人在线播放| 久久久久五月天| 亚洲国产免费av| 久久全球大尺度高清视频| 亚洲欧美日韩国产中文专区| 亚洲精品suv精品一区二区| 91精品视频一区| 91po在线观看91精品国产性色| 成人黄色生活片| 欧美性生交xxxxxdddd| 中文字幕日韩精品在线| 欧美国产视频一区二区| 青青草成人在线| 欧美色图在线视频| 97**国产露脸精品国产| 成人精品视频99在线观看免费| 欧美精品在线看| 国产精品高潮粉嫩av| 影音先锋日韩有码| 久久久久久久激情视频| 欧美高清videos高潮hd| 亚洲精选一区二区| 久久免费国产精品1| 精品福利在线视频| 中文字幕日韩有码| 亚洲精品大尺度| 成人欧美在线视频| 8050国产精品久久久久久| 欧美插天视频在线播放| 日本精品久久中文字幕佐佐木| 欧美亚洲激情在线| 久久精品免费电影| 亚洲第一视频在线观看| 国产精品久久久久免费a∨大胸| 久久精品免费电影| 久久久久久久久久久免费| 中文字幕亚洲无线码在线一区| 成人免费福利在线| 国产成人a亚洲精品| 成人欧美一区二区三区黑人孕妇| 欧美体内谢she精2性欧美| 欧美日韩亚洲一区二区三区| 人人澡人人澡人人看欧美| 国产精品入口免费视频一| 亚洲丝袜av一区| 欧美午夜精品伦理| 久久久精品一区二区三区| 国产成人亚洲综合91精品| 国产午夜精品美女视频明星a级| 久久久久久中文| 国产亚洲激情在线| 亚洲精品二三区| 在线播放国产一区中文字幕剧情欧美| 成人观看高清在线观看免费| 最新日韩中文字幕| 国产精品日本精品| 亚洲欧洲美洲在线综合| 欧美激情在线狂野欧美精品| 亚洲r级在线观看| 国产精品美腿一区在线看| 国语自产精品视频在线看抢先版图片| 亚洲另类欧美自拍| 久久人人爽人人| 三级精品视频久久久久| 91久久国产精品91久久性色| 国产日产亚洲精品| 久久99久久久久久久噜噜| 欧美床上激情在线观看| 97欧美精品一区二区三区| www.久久草.com| 欧美乱大交xxxxx另类电影| 最近2019中文免费高清视频观看www99| 成人av资源在线播放| 亚洲人成亚洲人成在线观看| 日韩av在线精品| 精品中文字幕在线观看| 日韩欧美成人区| 秋霞av国产精品一区| 91精品国产91久久久| 久久综合网hezyo| 亚洲综合中文字幕在线观看| 日韩av综合网站| 国产精品久久久久99| 91精品在线看| 国产精品久久一| 欧美中文字幕在线| 91精品国产99久久久久久| 欧美成人免费va影院高清| 狠狠爱在线视频一区| 欧美男插女视频| 中文字幕欧美精品日韩中文字幕| 亚洲第一免费播放区| 51久久精品夜色国产麻豆| 69影院欧美专区视频| 国产精品大陆在线观看| 日韩高清有码在线| 久久久久久久久国产| 91精品视频在线看| 黑人巨大精品欧美一区免费视频| 亚洲成人网久久久| 欧美亚洲激情在线| 色阁综合伊人av| 亚洲一级黄色av| 亚洲天堂av电影| 日韩欧美国产中文字幕| 77777少妇光屁股久久一区|