亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Regex > 正文

正則表達式匹配解析過程探討分析(正則表達式匹配原理)

2020-03-16 21:03:05
字體:
來源:轉載
供稿:網友
已經有多篇關于正則表達式介紹的文章,隨著我們越來越多使用正則表達式,想對性能做優化、減少我們正則表達式書寫匹配Bug。我們不得不進一步深入了解正則表達式執行過程了
 

已經有多篇關于正則表達式介紹的文章,隨著我們越來越多使用正則表達式,想對性能做優化、減少我們正則表達式書寫匹配Bug。我們不得不進一步深入了解正則表達式執行過程了。下面我們一起學習,分析下正則表達式執行過程。我們會用regexbuddy測試工具分解執行過程,具體工具使用,可以看:正則表達式性能測試工具推薦、優化工具推薦(regexbuddy推薦)。要了解正則表達式解析過程前,我們先來熟悉幾個概念。

常見正則表達式引擎
引擎決定了正則表達式匹配方法及內部搜索過程,了解它至關重要的。目前主要流行引擎有:DFA,NFA兩種引擎,我們比較區分下。

 

引擎 區別點
DFA
Deterministic finite automaton 
確定型有窮自動機
DFA引擎它們不要求回溯(并因此它們永遠不測試相同的字符兩次),所以匹配速度快!DFA引擎還可以匹配最長的可能的字符串。不過DFA引擎只包含有限的狀態,所以它不能匹配具有反向引用的模式,還不可以捕獲子表達式。代表性有:awk,egrep,flex,lex,MySQL,Procmail
NFA
Non-deterministic finite automaton 非確定型有窮自動機,又分為傳統NFA,Posix NFA
傳統的NFA引擎運行所謂的“貪婪的”匹配回溯算法(longest-leftmost),以指定順序測試正則表達式的所有可能的擴展并接受第一個匹配項。傳統的NFA回溯可以訪問完全相同的狀態多次,在最壞情況下,它的執行速度可能非常慢,但它支持子匹配。代表性有:GNU Emacs,Java,ergp,less,more,.NET語言,
PCRE library,Perl,PHP,Python,Ruby,sed,vi等,
一般高級語言都采用該模式。

 

DFA以字符串字符,逐個在正則表達式匹配查找,而NFA以正則表達式為主,在字符串中逐一查找。盡管速度慢,但是對操作者來說更簡單,因此應用更廣泛!下面所有以NFA引擎舉例說明,解析過程!

 

解析引擎眼中的字符串組成
對于字符串“DEF”而言,包括D、E、F三個字符和 0、1、2、3 四個數字位置:0D1E2F3,對于正則表達式而言所有源字符串,都有字符和位置。正則表達式會從0號位置,逐個去匹配的。

占有字符和零寬度
正則表達式匹配過程中,如果子表達式匹配到的是字符內容,而非位置,并被保存到最終的匹配結果中,那么就認為這個子表達式是占有字符的;如果子表達式匹配的僅僅是位置,或者匹配的內容并不保存到最終的匹配結果中,那么就認為這個子表達式是零寬度的。占有字符是互斥的,零寬度是非互斥的。也就是一個字符,同一時間只能由一個子表達式匹配,而一個位置,卻可以同時由多個零寬度的子表達式匹配。常見零寬字符有:^,(?=)等

正則表達式匹配過程詳解實例
我們掌握了上面幾個概念,我們接下來分析下幾個常見的解析過程。結合使用軟件regexBuddy來分析。

Demo1: 源字符DEF,對應標記是:0D1E2F3,匹配正則表達式是:/DEF/

正則表達式匹配解析過程探討分析(正則表達式匹配原理)

過程可以理解為:首先由正則表達式字符 /D/ 取得控制權,從位置0開始匹配,由 /D/ 來匹配“D”,匹配成功,控制權交給字符 /E/ ;由于“D”已被 /D/ 匹配,所以 /E/ 從位置1開始嘗試匹配,由 /E/ 來匹配“E”,匹配成功,控制權交給 /F/ ;由 /F/ 來匹配“F”,匹配成功。

Demo2:源字符DEF,對應標記是:0D1E2F3,匹配正則表達式是:/D/w+F/

正則表達式匹配解析過程探討分析(正則表達式匹配原理)

過程可以理解為:首先由正則表達式字符 /D/ 取得控制權,從位置0開始匹配,由 /D/ 來匹配“D”,匹配成功,控制權交給字符 //w+/ ;由于“D”已被 /D/ 匹配,所以 //w+/ 從位置1開始嘗試匹配,/w+貪婪模式,會記錄一個備選狀態,默認會匹配最長字符,直接匹配到EF,并且匹配成功,當前位置3了。并且把控制權交給 /F/ ;由 /F/ 匹配失敗,/w+匹配會回溯一位,當前位置變成2。并把控制權交個/F/,由/F/匹配字符F成功。因此/w+這里匹配E字符,匹配完成!

Demo3:源字符DEF,對應標記是:0D1E2F3,匹配正則表達式是:/^(?=D)[D-F]+$/

正則表達式匹配解析過程探討分析(正則表達式匹配原理)

過程可以理解為:元字符 /^/ 和 /$/ 匹配的只是位置,順序環視 /(?=D)/ (匹配當前位置,右邊是否有字符“D”字符出現)只進行匹配,并不占有字符,也不將匹配的內容保存到最終的匹配結果,所以都是零寬度的。 首先由元字符 /^/ 取得控制權,從位置0開始匹配, /^/ 匹配的就是開始位置“位置0”,匹配成功,控制權交給順序環視 /(?=D)/;/(?=D])/ 要求它所在位置右側必須是字母”D”才能匹配成功,零寬度的子表達式之間是不互斥的,即同一個位置可以同時由多個零寬度子表達式匹配,所以它也是從位置0嘗試進行匹配,位置0的右側是字符“D”,符合要求,匹配成功,控制權交給 /[D-F]+/ ;因為 /(?=D)/ 只進行匹配,并不將匹配到的內容保存到最后結果,并且 /(?=D)/ 匹配成功的位置是位置0,所以 /[D-F]+/ 也是從位置0開始嘗試匹配的, /[D-F]+/ 首先嘗試匹配“D”,匹配成功,繼續嘗試匹配,直到匹配完”EF”,這時已經匹配到位置3,位置3的右側已沒有字符,這時會把控制權交給 /$/,元字符 /$/ 從位置3開始嘗試匹配,它匹配的是結束位置,也就是“位置3”,匹配成功。此時正則表達式匹配完成,報告匹配成功。匹配結果為“DEF”,開始位置為0,結束位置為3。其中 /^/ 匹配位置0, /(?=D)/ 匹配位置0, /[D-F]+/ 匹配字符串“DEF”, /$/ 匹配位置3。

 

后記:上面這幾個例子,我們分析了正則表達式普通匹配,還有回溯過程,然后零寬度字符,匹配過程。當然,給出的例子比較簡單,實際過程中會遇到更長,更復雜的正則表達式。但是,思想是類似的。只要我們把我解析原理,都可以逐一分解的。好了,就到這里,歡迎交流!


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
欧美极品少妇xxxxⅹ免费视频| 欧美情侣性视频| 日韩精品福利在线| 精品动漫一区二区三区| 91人成网站www| 欧美成人精品在线视频| 国产亚洲成精品久久| 9.1国产丝袜在线观看| 亚洲xxx大片| 日韩精品视频免费专区在线播放| 成人av.网址在线网站| 一区二区欧美日韩视频| 国产午夜精品一区二区三区| 亚洲成人三级在线| 国产日韩欧美在线视频观看| 日韩精品亚洲精品| 国产网站欧美日韩免费精品在线观看| 国产亚洲精品久久久优势| 久久激情五月丁香伊人| 欧美韩国理论所午夜片917电影| 国产区精品在线观看| 亚洲免费av电影| 欧美日韩一区二区精品| 亚洲色图欧美制服丝袜另类第一页| 91久久精品视频| 日韩视频在线观看免费| 欧美大片免费观看在线观看网站推荐| 国产精品h在线观看| 欧美成人一二三| 久久亚洲私人国产精品va| 国产精品美女久久久免费| 亚洲成人激情在线| 亚洲国产美女精品久久久久∴| 国产一区二区三区四区福利| 久久久精品电影| 亚洲成人激情小说| 奇门遁甲1982国语版免费观看高清| 欧美日韩一区二区精品| 欧美激情亚洲自拍| 日本精品中文字幕| 亚洲精品丝袜日韩| 疯狂做受xxxx欧美肥白少妇| 日本欧美黄网站| 浅井舞香一区二区| 欧美激情在线有限公司| 欧美在线视频免费| 国产欧美精品久久久| 亚洲欧美国产一本综合首页| 成人欧美一区二区三区黑人| 国产精品一区=区| 久久久久久久电影一区| 国产91精品在线播放| yellow中文字幕久久| 91免费的视频在线播放| 日韩最新av在线| 国产成人91久久精品| 日韩中文字幕视频| 浅井舞香一区二区| 午夜欧美大片免费观看| 日韩一区二区在线视频| 亚洲国产精品久久| 97精品国产91久久久久久| 国产国语videosex另类| 日韩精品在线第一页| 欧美成人精品在线观看| 色老头一区二区三区在线观看| 国产在线精品播放| 亚洲视频在线观看视频| 国产精品视频成人| 日韩欧美国产网站| 日韩欧美aaa| 欧洲亚洲免费在线| 久久亚洲春色中文字幕| 日本精品性网站在线观看| 日韩av资源在线播放| 91精品在线国产| 欧美日韩精品在线播放| 97久久精品视频| 日韩国产精品亚洲а∨天堂免| 夜夜狂射影院欧美极品| 国产成人自拍视频在线观看| 国产亚洲视频在线| 国产精品久久久久久久久久尿| 国产一区二区三区在线| 亚洲高清av在线| 亚洲欧美中文在线视频| 国产精品视频26uuu| 亚洲精品日韩久久久| 91在线中文字幕| 欧美激情xxxx性bbbb| xvideos国产精品| 欧美激情精品久久久久| 成人免费网站在线| 亚洲最大在线视频| 成人乱人伦精品视频在线观看| 久久久久北条麻妃免费看| 中文字幕精品www乱入免费视频| 亚洲一区二区免费在线| 亚洲码在线观看| 91国在线精品国内播放| 亚洲国产高清自拍| 亚洲人av在线影院| 精品无码久久久久久国产| 久久久久成人网| 国产精品99免视看9| 国产视频欧美视频| 日韩欧美一区视频| 国内外成人免费激情在线视频网站| 日韩精品中文字幕久久臀| 欧美日韩国产限制| 亚洲天堂av在线免费| 国产日韩一区在线| 欧美激情xxxxx| 91视频免费网站| 久久夜色精品国产欧美乱| 精品国偷自产在线视频| 亚洲天堂成人在线| 国产欧美日韩最新| 亚洲男人天堂古典| 国产免费一区二区三区在线能观看| 2019中文字幕全在线观看| 黄色成人在线播放| 色诱女教师一区二区三区| 国产中文字幕日韩| 日韩av在线电影网| 中文字幕精品一区二区精品| 国产精品久久久久久久美男| 精品五月天久久| 国产精品免费一区豆花| 欧美片一区二区三区| 欧美激情va永久在线播放| 国产69久久精品成人看| 国产日韩综合一区二区性色av| 亚洲激情视频在线观看| 国产精品a久久久久久| 成人精品一区二区三区电影免费| 欧美在线视频a| 最近2019中文字幕mv免费看| 成人黄色短视频在线观看| 精品国产户外野外| 91精品久久久久久久久久久久久久| 午夜精品久久久久久99热软件| 国产精品亚洲аv天堂网| 国产一区欧美二区三区| 福利一区视频在线观看| 亚洲第一av网| 亚洲已满18点击进入在线看片| 欧美激情一级精品国产| 欧美肥老太性生活视频| 日韩欧中文字幕| 国产91精品在线播放| 国产精品96久久久久久| 日韩动漫免费观看电视剧高清| 久久久久国产精品免费网站| 国产精品丝袜久久久久久高清| 欧美国产第二页| 久久精品成人欧美大片| 久久天天躁狠狠躁夜夜爽蜜月| 97久久超碰福利国产精品…| 亚洲精品www| 精品美女久久久久久免费| 国产日韩欧美在线观看| 日韩av三级在线观看| 91精品国产91久久久久久不卡|