亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Regex > 正文

正則基礎之 NFA引擎匹配原理

2020-03-16 21:16:28
字體:
來源:轉載
供稿:網友
不懂正則引擎原理的情況下,同樣可以寫出滿足需求的正則,但是不知道原理,卻很難寫出高效且沒有隱患的正則。所以對于經常使用正則,或是有興趣深入學習正則的人,還是有必要了解一下正則引擎的匹配原理的。
 
 

1       為什么要了解引擎匹配原理

一個個音符雜亂無章的組合在一起,彈奏出的或許就是噪音,同樣的音符經過作曲家的手,就可以譜出非常動聽的樂曲,一個演奏者同樣可以照著樂譜奏出動聽的樂曲,但他/她或許不知道該如何去改變音符的組合,使得樂曲更動聽。

作為正則的使用者也一樣,不懂正則引擎原理的情況下,同樣可以寫出滿足需求的正則,但是不知道原理,卻很難寫出高效且沒有隱患的正則。所以對于經常使用正則,或是有興趣深入學習正則的人,還是有必要了解一下正則引擎的匹配原理的。

2       正則表達式引擎

正則引擎大體上可分為不同的兩類:DFA和NFA,而NFA又基本上可以分為傳統型NFA和POSIX NFA。

DFA Deterministic finite automaton 確定型有窮自動機

NFA Non-deterministic finite automaton 非確定型有窮自動機

Traditional NFA

POSIX NFA

DFA引擎因為不需要回溯,所以匹配快速,但不支持捕獲組,所以也就不支持反向引用和$number這種引用方式,目前使用DFA引擎的語言和工具主要有awk、egrep 和 lex。

POSIX NFA主要指符合POSIX標準的NFA引擎,它的特點主要是提供longest-leftmost匹配,也就是在找到最左側最長匹配之前,它將繼續回溯。同DFA一樣,非貪婪模式或者說忽略優先量詞對于POSIX NFA同樣是沒有意義的。

大多數語言和工具使用的是傳統型的NFA引擎,它有一些DFA不支持的特性:

  捕獲組、反向引用和$number引用方式;

  環視(Lookaround,(?<=…)、(?<!…)、(?=…)、(?!…)),或者有的有文章叫做預搜索;

  忽略優化量詞(??、*?、+?、{m,n}?、{m,}?),或者有的文章叫做非貪婪模式;

  占有優先量詞(?+、*+、++、{m,n}+、{m,}+,目前僅Java和PCRE支持),固化分組(?>…)。

引擎間的區別不是本文的重點,僅做簡要的介紹,有興趣的可參考相關文獻。

3       預備知識

3.1     字符串組成

正則基礎之 NFA引擎匹配原理

對于字符串“abc”而言,包括三個字符和四個位置。

3.2     占有字符和零寬度

正則表達式匹配過程中,如果子表達式匹配到的是字符內容,而非位置,并被保存到最終的匹配結果中,那么就認為這個子表達式是占有字符的;如果子表達式匹配的僅僅是位置,或者匹配的內容并不保存到最終的匹配結果中,那么就認為這個子表達式是零寬度的。

占有字符是互斥的,零寬度是非互斥的。也就是一個字符,同一時間只能由一個子表達式匹配,而一個位置,卻可以同時由多個零寬度的子表達式匹配。

3.3     控制權和傳動

正則的匹配過程,通常情況下都是由一個子表達式(可能為一個普通字符、元字符或元字符序列組成)取得控制權,從字符串的某一位置開始嘗試匹配,一個子表達式開始嘗試匹配的位置,是從前一子表達匹配成功的結束位置開始的。如正則表達式:

(子表達式一)(子表達式二)

假設(子表達式一)為零寬度表達式,由于它匹配開始和結束的位置是同一個,如位置0,那么(子表達式二)是從位置0開始嘗試匹配的。

假設(子表達式一)為占有字符的表達式,由于它匹配開始和結束的位置不是同一個,如匹配成功開始于位置0,結束于位置2,那么(子表達式二)是從位置2開始嘗試匹配的。

而對于整個表達式來說,通常是由字符串位置0開始嘗試匹配的。如果在位置0開始的嘗試,匹配到字符串某一位置時整個表達式匹配失敗,那么引擎會使正則向前傳動,整個表達式從位置1開始重新嘗試匹配,依此類推,直到報告匹配成功或嘗試到最后一個位置后報告匹配失敗。

4       正則表達式簡單匹本過程

4.1     基礎匹配過程

 

正則基礎之 NFA引擎匹配原理

源字符串:abc

正則表達式:abc

匹配過程:

首先由字符“a”取得控制權,從位置0開始匹配,由“a”來匹配“a”,匹配成功,控制權交給字符“b”;由于“a”已被“a”匹配,所以“b”從位置1開始嘗試匹配,由“b”來匹配“b”,匹配成功,控制權交給“c”;由“c”來匹配“c”,匹配成功。

此時正則表達式匹配完成,報告匹配成功。匹配結果為“abc”,開始位置為0,結束位置為3。

 

4.2     含有匹配優先量詞的匹配過程——匹配成功(一)

正則基礎之 NFA引擎匹配原理

源字符串:abc

正則表達式:ab?c

量詞“?”屬于匹配優先量詞,在可匹配可不匹配時,會先選擇嘗試匹配,只有這種選擇會使整個表達式無法匹配成功時,才會嘗試讓出匹配到的內容。這里的量詞“?”是用來修飾字符“b”的,所以“b?”是一個整體。

匹配過程:

首先由字符“a”取得控制權,從位置0開始匹配,由“a”來匹配“a”,匹配成功,控制權交給字符“b?”;由于“?”是匹配優先量詞,所以會先嘗試進行匹配,由“b?”來匹配“b”,匹配成功,控制權交給“c”,同時記錄一個備選狀態;由“c”來匹配“c”,匹配成功。記錄的備選狀態丟棄。

此時正則表達式匹配完成,報告匹配成功。匹配結果為“abc”,開始位置為0,結束位置為3。

4.3     含有匹配優先量詞的匹配過程——匹配成功(二)

正則基礎之 NFA引擎匹配原理

源字符串:ac

正則表達式:ab?c

匹配過程:

首先由字符“a”取得控制權,從位置0開始匹配,由“a”來匹配“a”,匹配成功,控制權交給字符“b?”;先嘗試進行匹配,由“b?”來匹配“c”,同時記錄一個備選狀態,匹配失敗,此時進行回溯,找到備選狀態,“b?”忽略匹配,讓出控制權,把控制權交給“c”;由“c”來匹配“c”,匹配成功。

此時正則表達式匹配完成,報告匹配成功。匹配結果為“ac”,開始位置為0,結束位置為2。其中“b?”不匹配任何內容。

4.4     含有匹配優先量詞的匹配過程——匹配失敗

正則基礎之 NFA引擎匹配原理

源字符串:abd

正則表達式:ab?c

匹配過程:

首先由字符“a”取得控制權,從位置0開始匹配,由“a”來匹配“a”,匹配成功,控制權交給字符“b?”;先嘗試進行匹配,由“b?”來匹配“b”,同時記錄一個備選狀態,匹配成功,控制權交給“c”;由“c”來匹配“d”,匹配失敗,此時進行回溯,找到記錄的備選狀態,“b?”忽略匹配,即“b?”不匹配“b”,讓出控制權,把控制權交給“c”;由“c”來匹配“b”,匹配失敗。此時第一輪匹配嘗試失敗。

正則引擎使正則向前傳動,由位置1開始嘗試匹配,由“a”來匹配“b”,匹配失敗,沒有備選狀態,第二輪匹配嘗試失敗。

繼續向前傳動,直到在位置3嘗試匹配失敗,匹配結束。此時報告整個表達式匹配失敗。

4.5     含有忽略優先量詞的匹配過程——匹配成功

正則基礎之 NFA引擎匹配原理

源字符串:abc

正則表達式:ab??c

量詞“??”屬于忽略優先量詞,在可匹配可不匹配時,會先選擇不匹配,只有這種選擇會使整個表達式無法匹配成功時,才會嘗試進行匹配。這里的量詞“??”是用來修飾字符“b”的,所以“b??”是一個整體。

匹配過程:

首先由字符“a”取得控制權,從位置0開始匹配,由“a”來匹配“a”,匹配成功,控制權交給字符“b??”;先嘗試忽略匹配,即“b??”不進行匹配,同時記錄一個備選狀態,控制權交給“c”;由“c”來匹配“b”,匹配失敗,此時進行回溯,找到記錄的備選狀態,“b??”嘗試匹配,即“b??”來匹配“b”,匹配成功,把控制權交給“c”;由“c”來匹配“c”,匹配成功。

此時正則表達式匹配完成,報告匹配成功。匹配結果為“abc”,開始位置為0,結束位置為3。其中“b??”匹配字符“b”。

4.6     零寬度匹配過程

正則基礎之 NFA引擎匹配原理

源字符串:a12

正則表達式:^(?=[a-z])[a-z0-9]+$

元字符“^”和“$”匹配的只是位置,順序環視“(?=[a-z])”只進行匹配,并不占有字符,也不將匹配的內容保存到最終的匹配結果,所以都是零寬度的。

這個正則的意義就是匹配由字母和數字組成的,第一個字符是字母的字符串。

匹配過程:

首先由元字符“^”取得控制權,從位置0開始匹配,“^”匹配的就是開始位置“位置0”,匹配成功,控制權交給順序環視“(?=[a-z])”;

(?=[a-z])”要求它所在位置右側必須是字母才能匹配成功,零寬度的子表達式之間是不互斥的,即同一個位置可以同時由多個零寬度子表達式匹配,所以它也是從位置0嘗試進行匹配,位置0的右側是字符“a”,符合要求,匹配成功,控制權交給“[a-z0-9]+”;

因為“(?=[a-z])”只進行匹配,并不將匹配到的內容保存到最后結果,并且“(?=[a-z])”匹配成功的位置是位置0,所以“[a-z0-9]+”也是從位置0開始嘗試匹配的,“[a-z0-9]+”首先嘗試匹配“a”,匹配成功,繼續嘗試匹配,可以成功匹配接下來的“1”和“2”,此時已經匹配到位置3,位置3的右側已沒有字符,這時會把控制權交給“$”;

元字符“$”從位置3開始嘗試匹配,它匹配的是結束位置,也就是“位置3”,匹配成功。

此時正則表達式匹配完成,報告匹配成功。匹配結果為“a12”,開始位置為0,結束位置為3。其中“^”匹配位置0,“(?=[a-z])”匹配位置0,“[a-z0-9]+”匹配字符串“a12”,“$”匹配位置3。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
在线视频中文亚洲| 亚洲欧美日韩中文在线| 日韩欧美精品中文字幕| 欧美一级电影在线| 国产精品视频区| 亚洲欧美激情四射在线日| 色中色综合影院手机版在线观看| 欧美日韩一区二区三区| 亚洲欧美日韩高清| 国产亚洲精品久久| 亚洲一区二区三区成人在线视频精品| 国产精欧美一区二区三区| 国产精品久久91| 亚洲第一免费播放区| 日本韩国欧美精品大片卡二| 在线观看欧美成人| 欧美视频不卡中文| 欧洲精品在线视频| 美女福利视频一区| 欧美大片网站在线观看| 国产精品久久久久久久久久ktv| 正在播放国产一区| 欧美精品videofree1080p| 国产精品网红福利| 欧美一区二区大胆人体摄影专业网站| 中文字幕日韩高清| 亚洲成人黄色在线观看| 久久久久日韩精品久久久男男| 国产91精品青草社区| 亚洲少妇激情视频| 亚洲最大中文字幕| 成人夜晚看av| 日韩中文字幕在线免费观看| 欧美激情三级免费| 国产一区二区三区日韩欧美| 成人久久18免费网站图片| 亚洲丝袜在线视频| 精品国产福利在线| 狠狠躁夜夜躁人人爽超碰91| 俺去了亚洲欧美日韩| 亚洲电影中文字幕| 久久国产精品久久国产精品| 中文字幕在线日韩| 日韩电影在线观看永久视频免费网站| 97色在线观看| 国产精品黄色影片导航在线观看| 深夜福利一区二区| 91精品综合久久久久久五月天| 中文字幕日韩av电影| 欧美交受高潮1| 日韩美女写真福利在线观看| 日韩精品中文字幕在线播放| 亚洲福利视频网| 日韩美女在线看| 欧美专区中文字幕| 日韩av在线一区二区| 亚洲欧美中文在线视频| 精品成人在线视频| 亚州精品天堂中文字幕| 疯狂蹂躏欧美一区二区精品| 亚洲免费视频在线观看| 最近免费中文字幕视频2019| 国产精品国内视频| 欧美日韩国产二区| 国产欧美日韩免费看aⅴ视频| 亚洲精品99久久久久| 欧美精品videos另类日本| 欧美激情日韩图片| 国产欧美精品一区二区| 国产成人精彩在线视频九色| 国产91色在线播放| 黑人狂躁日本妞一区二区三区| 国产成人精品电影久久久| 亚洲精品国产拍免费91在线| 亚洲香蕉在线观看| 中文日韩电影网站| 亚洲精品国产品国语在线| 日日噜噜噜夜夜爽亚洲精品| 国产视频观看一区| 亚洲高清色综合| 欧美视频在线观看免费网址| 日韩欧美在线字幕| 97福利一区二区| 欧美在线观看网址综合| 中文字幕av一区| 亚洲奶大毛多的老太婆| 欧美日韩国产精品| 国产精品久久久久久久天堂| 亚洲免费影视第一页| 亚洲成人av资源网| 色偷偷888欧美精品久久久| 亚洲91av视频| 国产做受69高潮| 日本精品一区二区三区在线播放视频| 国产成人亚洲综合91| 亚洲国产小视频在线观看| 亚洲欧美日韩一区在线| 日韩中文理论片| 成人免费观看49www在线观看| 国产一区二区丝袜高跟鞋图片| 精品丝袜一区二区三区| 国产精品入口夜色视频大尺度| 日韩久久免费视频| 欧美综合在线第二页| 欧美成人剧情片在线观看| 亚洲人成在线免费观看| 清纯唯美日韩制服另类| 午夜精品久久久久久久白皮肤| 国产免费一区二区三区在线能观看| 国产精品久久99久久| www.欧美三级电影.com| 在线不卡国产精品| 精品亚洲精品福利线在观看| 中文字幕在线亚洲| 亚洲自拍av在线| 高清在线视频日韩欧美| 欧美另类老肥妇| 亚洲欧美成人网| 欧美精品久久一区二区| 一区二区欧美在线| 日韩美女毛茸茸| 欧美午夜片欧美片在线观看| 欧美成人精品一区二区| 国产精品永久免费观看| 国产日本欧美在线观看| 最新69国产成人精品视频免费| 成人疯狂猛交xxx| 欧美另类在线观看| 日韩在线不卡视频| 亚洲国模精品一区| 亚洲人高潮女人毛茸茸| 日韩精品在线观看一区二区| 91夜夜未满十八勿入爽爽影院| 日韩精品视频在线| 国产精品视频中文字幕91| 亚洲黄色片网站| 国产欧美日韩综合精品| 青草成人免费视频| 亚洲欧美日韩一区二区在线| 精品高清一区二区三区| 日韩av影院在线观看| 国产精品免费一区二区三区都可以| 精品伊人久久97| 亚洲美女www午夜| 久久久久亚洲精品国产| 国产色婷婷国产综合在线理论片a| 69久久夜色精品国产69乱青草| 日韩精品视频在线免费观看| 欧美日韩一区二区在线播放| 亚洲一区二区在线| 亚洲一区中文字幕在线观看| 久久国产精品视频| 国产精品午夜一区二区欲梦| 91丝袜美腿美女视频网站| 欧美精品激情blacked18| 欧美激情亚洲另类| 亚洲а∨天堂久久精品9966| 国产在线拍偷自揄拍精品| 亚洲男人天堂2024| 亚洲欧美在线免费观看| 亚洲美女福利视频网站| 欧美激情xxxxx| 国产精品白丝av嫩草影院| 国产中文字幕亚洲|