亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > regex > 正文

正則表達式零寬斷言詳解

2020-01-20 22:05:15
字體:
來源:轉載
供稿:網友

正則表達式零寬斷言:

零寬斷言是正則表達式中的難點,所以本章節重點從匹配原理方面進行一下分析。零寬斷言還有其他的名稱,例如"環視"或者"預搜索"等等,不過這些都不是我們關注的重點。

一.基本概念:

零寬斷言正如它的名字一樣,是一種零寬度的匹配,它匹配到的內容不會保存到匹配結果中去,最終匹配結果只是一個位置而已。
作用是給指定位置添加一個限定條件,用來規定此位置之前或者之后的字符必須滿足限定條件才能使正則中的字表達式匹配成功。
注意:這里所說的子表達式并非只有用小括號括起來的表達式,而是正則表達式中的任意匹配單元。
javascript只支持零寬先行斷言,而零寬先行斷言又可以分為正向零寬先行斷言,和負向零寬先行斷言。

代碼實例如下:

實例代碼一:

var str="abZW863";var reg=/ab(?=[A-Z])/;console.log(str.match(reg));

在以上代碼中,正則表達式的語義是:匹配后面跟隨任意一個大寫字母的字符串"ab"。最終匹配結果是"ab",因為零寬斷言"(?=[A-Z])"并不匹配任何字符,只是用來規定當前位置的后面必須是一個大寫字母。

實例代碼二:

var str="abZW863";var reg=/ab(?![A-Z])/;console.log(str.match(reg));

以上代碼中,正則表達式的語義是:匹配后面不跟隨任意一個大寫字母的字符串"ab"。正則表達式沒能匹配任何字符,因為在字符串中,ab的后面跟隨有大寫字母。

二.匹配原理:

上面代碼只是用概念的方式介紹了零寬斷言是如何匹配的。
下面就以匹配原理的方式分別介紹一下正向零寬斷言和負向零寬斷言是如何匹配的。
1.正向零寬斷言:
代碼實例如下:

var str="<div>antzone";var reg=/^(?=<)<[^>]+>/w+/;console.log(str.match(reg));

匹配過程如下:
首先由正則表達式中的"^"獲取控制權,首先由位置0開始進行匹配,它匹配開始位置0,匹配成功,然后控制權轉交給"(?=<)",,由于"^"是零寬的,所以"(?=<)"也是從位置0處開始匹配,它要求所在的位置右側必須是字符"<",位置0的右側恰好是字符"<",匹配成功,然后控制權轉交個"<",由于"(?=<)"也是零寬的,所以它也是從位置0處開始匹配,于是匹配成功,后面的匹配過程就不介紹了。

2.負向零寬斷言:

代碼實例如下:

var str="abZW863ab88"; var reg=/ab(?![A-Z])/g; console.log(str.match(reg));

匹配過程如下:
首先由正則表達式的字符"a"獲取控制權,從位置0處開始匹配,匹配字符"a"成功,然后控制權轉交給"b",從位置1處開始匹配,配字符"b"成功,然后控制權轉交給"(?![A-Z])",它從位置2處開始匹配,它要求所在位置的右邊不能夠是任意一個大寫字母,而位置的右邊是大寫字母"Z",匹配失敗,然后控制權又重新交給字符"a",并從位置1處開始嘗試,匹配失敗,然后控制權再次交給字符"a",從位置2處開始嘗試匹配,依然失敗,如此往復嘗試,直到從位置7處開始嘗試匹配成功,然后將控制權轉交給"b",然后從位置8處開始嘗試匹配,匹配成功,然后再將控制權轉交給"(?![A-Z])",它從位置9處開始嘗試匹配,它規定它所在的位置右邊不能夠是大寫字母,匹配成功,但是它并不會真正匹配字符,所以最終匹配結果是"ab"。

以下是補充

零寬斷言是正則表達式中的一種方法,正則表達式在計算機科學中,是指一個用來描述或者匹配一系列符合某個句法規則的字符串的單個字符串。

定義解釋

零寬斷言是正則表達式中的一種方法
正則表達式在計算機科學中,是指一個用來描述或者匹配一系列符合某個句法規則的字符串的單個字符串。在很多文本編輯器或其他工具里,正則表達式通常被用來檢索和/或替換那些符合某個模式的文本內容。許多程序設計語言都支持利用正則表達式進行字符串操作。例如,在Perl中就內建了一個功能強大的正則表達式引擎。正則表達式這個概念最初是由Unix中的工具軟件(例如sed和grep)普及開的。正則表達式通??s寫成“regex”,單數有regexp、regex,復數有regexps、regexes、regexen。

零寬斷言

用于查找在某些內容(但并不包括這些內容)之前或之后的東西,也就是說它們像/b,^,$那樣用于指定一個位置,這個位置應該滿足一定的條件(即斷言),因此它們也被稱為零寬斷言。最好還是拿例子來說明吧: 斷言用來聲明一個應該為真的事實。正則表達式中只有當斷言為真時才會繼續進行匹配。

(?=exp)也叫零寬度正預測先行斷言,它斷言自身出現的位置的后面能匹配表達式exp。比如/b(?=re)/w+/b,匹配以re開頭的單詞的后面部分(除了re以外的部分),如查找reading a book.時,它會匹配ading。

var reg = new Regex(@"/w+(?=ing)");var str = "muing";Console.WriteLine(reg.Match(str).Value);//返回mu

(?<=exp)也叫零寬度正回顧后發斷言,它斷言自身出現的位置的前面能匹配表達式exp。比如/b/w+(?<=ing/b)會匹配以ing結尾的單詞的前半部分(除了ing以外的部分),例如在查找I am reading.時,它匹配read。

假如你想要給一個很長的數字中每三位間加一個逗號(當然是從右邊加起了),你可以這樣查找需要在前面和里面添加逗號的部分:((?=/d)/d{3})+/b,用它對1234567890進行查找時結果是234567890。
下面這個例子同時使用了這兩種斷言:(?<=/s)/d+(?=/s)匹配以空白符間隔的數字(再次強調,不包括這些空白符)。

負向零寬斷言

前面我們提到過怎么查找不是某個字符或不在某個字符類里的字符的方法(反義)。但是如果我們只是想要確保某個字符沒有出現,但并不想去匹配它時怎么辦?例如,如果我們想查找這樣的單詞--它里面出現了字母q,但是q后面跟的不是字母u,我們可以嘗試這樣:

/b/w*q[^u]/w*/b匹配包含后面不是字母u的字母q的單詞。但是如果多做測試(或者你思維足夠敏銳,直接就觀察出來了),你會發現,如果q出現在單詞的結尾的話,像Iraq,Benq,這個表達式就會出錯。這是因為[^u]總要匹配一個字符,所以如果q是單詞的最后一個字符的話,后面的[^u]將會匹配q后面的單詞分隔符(可能是空格,或者是句號或其它的什么),后面的/w*/b將會匹配下一個單詞,于是/b/w*q[^u]/w*/b就能匹配整個Iraq fighting。負向零寬斷言能解決這樣的問題,因為它只匹配一個位置,并不消費任何字符?,F在,我們可以這樣來解決這個問題:/b/w*q(?!u)/w*/b。

零寬度負預測先行斷言(?!exp),斷言此位置的后面不能匹配表達式exp。例如:/d{3}(?!/d)匹配三位數字,而且這三位數字的后面不能是數字;/b((?!abc)/w)+/b匹配不包含連續字符串abc的單詞。
同理,我們可以用(?<!exp),零寬度負回顧后發斷言來斷言此位置的前面不能匹配表達式exp:(?<![a-z])/d{7}匹配前面不是小寫字母的七位數字。

一個更復雜的例子:(?<=<(/w+)>).*(?=<///1>)匹配不包含屬性的簡單HTML標簽內里的內容。(<?=(/w+)>)指定了這樣的前綴:被尖括號括起來的單詞(比如可能是<b>),然后是.*(任意的字符串),最后是一個后綴(?=<///1>)。注意后綴里的//,它用到了前面提過的字符轉義;/1則是一個反向引用,引用的正是捕獲的第一組,前面的(/w+)匹配的內容,這樣如果前綴實際上是<b>的話,后綴就是</b>了。整個表達式匹配的是<b>和</b>之間的內容(再次提醒,不包括前綴和后綴本身)。

上面的看了有點傷腦筋啊。下面來點補充一

斷言用來聲明一個應該為真的事實。正則表達式中只有當斷言為真時才會繼續進行匹配。
接下來的四個用于查找在某些內容(但并不包括這些內容)之前或之后的東西,也就是說它們像/b,^,$那樣用于指定一個位置,這個位置應該滿足一定的條件(即斷言),因此它們也被稱為零寬斷言。最好還是拿例子來說明吧:

(?=exp)也叫零寬度正預測先行斷言,它斷言自身出現的位置的后面能匹配表達式exp。比如/b/w+(?=ing/b),匹配以ing結尾的單詞的前面部分(除了ing以外的部分),如查找I'm singing while you're dancing.時,它會匹配sing和danc。
(?<=exp)也叫零寬度正回顧后發斷言,它斷言自身出現的位置的前面能匹配表達式exp。比如(?<=/bre)/w+/b會匹配以re開頭的單詞的后半部分(除了re以外的部分),例如在查找reading a book時,它匹配ading。

假如你想要給一個很長的數字中每三位間加一個逗號(當然是從右邊加起了),你可以這樣查找需要在前面和里面添加逗號的部分:((?<=/d)/d{3})*/b,用它對1234567890進行查找時結果是234567890。
下面這個例子同時使用了這兩種斷言:(?<=/s)/d+(?=/s)匹配以空白符間隔的數字(再次強調,不包括這些空白符)。

補充二:

最近為了對html文件進行源碼處理,需要進行正則查找并替換。于是借著這個機會把正則系統地學一下,雖然以前也用過正則,但每次都是臨時學一下混過關的。在學習的過程中還是遇到不少問題的,特別是零寬斷言(這里還要吐槽下,網上到處都是都復制粘貼的內容,遇到個問題查看了不少重復的東西,汗!?。。?,所以在這里把自己的理解寫下來,方便以后查閱!

      零寬度正預測先行斷言是什么呢,看msdn上的官方解釋定義

(?= 子表達式)

(零寬度正預測先行斷言。)僅當子表達式在此位置的右側匹配時才繼續匹配。例如,/w+(?=/d) 與后跟數字的單詞匹配,而不與該數字匹配。

      經典的例子:某單詞以ing結尾,要獲取ing前面的內容

var reg = new Regex(@"/w+(?=ing)");var str = "muing";Console.WriteLine(reg.Match(str).Value);//返回mu

      以上是網上到處可見的例子,到這里或許你明白了,原來就是返回了exp表達式前面的內容。

     再看下面的的代碼

var reg = new Regex(@"a(?=b)c");var str = "abc";Console.WriteLine(reg.IsMatch(str));//返回false

      為什么會返回false?

     其實msdn官方定義已經說了,只是它說得很官方而已。這里需要我們注意一個關鍵點:此位置。沒錯,是位置而不是字符。那么結合官方定義和第一個例子來理解第二個例子:

     因為a后面是b,則此時返回了匹配內容a(由第一個例子知道,只返回a不返回exp匹配的內容),此時a(?=b)c中的a(?=b)部分已經解決了,接下來要解決c的匹配問題了,此時匹配c要從字符串abc哪里開始呢,結合官方定義,就知道是從子表達的位置向右開始的,那么就是從b的位置開始,但b又不匹配a(?=b)c剩余部分的c,所以abc就不匹配a(?=b)c了。

     那么如果要上面的進行匹配,正則應該如何寫呢?

     答案是:a(?=b)bc

     當然,有人會說直接abc就匹配上了,還要這么折騰嗎?當然不用這么折騰,只是為了說明零寬度正預測先行斷言到底是怎么一回事?關于其它的零寬斷言也是同一原理!

補充三

(?=exp):零寬度正預測先行斷言,它斷言自身出現的位置的后面能匹配表達式exp。

#匹配后面為_path,結果為product
  'product_path'.scan /(product)(?=_path)/

(?<=exp):零寬度正回顧后發斷言,它斷言自身出現的位置的前面能匹配表達式exp

#匹配前面為name:,結果為wangfei
'name:wangfei'.scan /(?<=name:)(wangfei)/ #wangfei

(?!exp):零寬度負預測先行斷言,斷言此位置的后面不能匹配表達式exp。

#匹配后面不是_path
'product_path'.scan /(product)(?!_path)/  #nil
#匹配后面不是_url
'product_path'.scan /(product)(?!_url)/  #product

(?<!exp):零寬度負回顧后發斷言來斷言此位置的前面不能匹配表達式exp

#匹配前面不是name:
'name:angelica'.scan /(?<!name:)(angelica)/  #nil
#匹配前面不是nick_name:
'name:angelica'.scan /(?<!nick_name:)(angelica)/#angelica

小編也受夠了這個東西,等有好的東西再分享,今天洗洗睡吧

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
亚洲在线www| 97久久精品在线| 日韩欧美精品在线观看| 中文字幕亚洲无线码在线一区| 在线日韩日本国产亚洲| 色yeye香蕉凹凸一区二区av| 久久久久久美女| 在线性视频日韩欧美| 在线视频日本亚洲性| 国产一区二区黑人欧美xxxx| 日本国产一区二区三区| 国产欧美 在线欧美| www.亚洲免费视频| 97av在线视频免费播放| 一区二区三欧美| 国产精品a久久久久久| 国产午夜精品麻豆| 久久九九有精品国产23| 欧美性受xxxx黑人猛交| 亚洲一品av免费观看| 亚洲午夜国产成人av电影男同| 精品国模在线视频| 国产91精品高潮白浆喷水| 欧美人与性动交a欧美精品| 亚洲精品国偷自产在线99热| 亚洲视频日韩精品| 国产深夜精品福利| 国产精品久久久久久久7电影| 欧美日韩xxxxx| 欧美另类高清videos| 欧美高跟鞋交xxxxhd| 日本久久中文字幕| 97香蕉久久夜色精品国产| 欧美视频在线观看免费网址| 中文字幕在线看视频国产欧美在线看完整| 色偷偷偷综合中文字幕;dd| 欧美日韩国产精品一区二区三区四区| 久久99精品国产99久久6尤物| 狠狠躁夜夜躁人人爽超碰91| 欧美人与性动交a欧美精品| 91手机视频在线观看| 亚洲国产精品高清久久久| 91欧美精品午夜性色福利在线| 亚洲国产美女久久久久| 午夜精品国产精品大乳美女| 成人福利免费观看| 国产精品99免视看9| 亚洲成人久久网| 欧美小视频在线观看| 91美女高潮出水| 久久久久久一区二区三区| 成人免费看片视频| 欧美激情在线观看视频| 久久免费视频网| 国产日韩在线亚洲字幕中文| 欧美日韩免费一区| 国产精品福利观看| 久久久久999| 国产福利精品av综合导导航| 91美女福利视频高清| 国产日韩视频在线观看| 日韩av在线直播| 国产精彩精品视频| 国产专区欧美专区| 亚洲人永久免费| 九九热这里只有在线精品视| 国产日韩欧美在线观看| 91影视免费在线观看| 成人激情视频网| 日韩av在线直播| 97视频在线观看网址| 国产91久久婷婷一区二区| 色在人av网站天堂精品| 日av在线播放中文不卡| 久久久久久久激情视频| 日韩a**站在线观看| 97热精品视频官网| 欧美日韩在线免费| 亚洲自拍偷拍色片视频| 欧美成人在线影院| 欧美国产日韩一区| 91精品国产九九九久久久亚洲| 亚洲精品视频播放| 91精品久久久久久久久| 亚洲自拍偷拍一区| 久久国产视频网站| 欧美日韩午夜视频在线观看| 亚洲午夜性刺激影院| 亚洲激情久久久| 海角国产乱辈乱精品视频| xvideos成人免费中文版| 国产成人精品电影| 日韩精品亚洲视频| 97高清免费视频| 亚洲影院在线看| 少妇高潮久久77777| 久久在精品线影院精品国产| 国产脚交av在线一区二区| 国产日韩在线播放| 亚洲国产一区二区三区在线观看| 欧美国产极速在线| 国产精品久久久久福利| 亚洲三级免费看| 国产精品一区二区女厕厕| 亚洲欧美一区二区三区久久| 亚洲www永久成人夜色| 成人xxxx视频| 日韩免费在线看| 色综合色综合久久综合频道88| 日韩av网站大全| 亚洲天堂网在线观看| 亚洲无亚洲人成网站77777| 亚洲va久久久噜噜噜| 亚洲美女视频网| 成人免费淫片aa视频免费| 欧美性猛交xxxx乱大交| 欧美巨乳美女视频| 欧美美最猛性xxxxxx| 成人xvideos免费视频| 欧美肥老妇视频| 另类视频在线观看| 国产精品一区二区电影| 搡老女人一区二区三区视频tv| 国产欧美精品一区二区三区介绍| 丝袜美腿亚洲一区二区| 国产香蕉一区二区三区在线视频| 国产精品久久久久久婷婷天堂| 欧美亚洲激情视频| 国产午夜精品久久久| 欧美国产亚洲视频| 久久久久久久久久久亚洲| 亚洲视频网站在线观看| 2019中文字幕免费视频| 视频在线一区二区| 欧美午夜视频在线观看| 欧美性猛交丰臀xxxxx网站| 亚洲日本中文字幕免费在线不卡| 亚洲成人黄色网| 美女视频黄免费的亚洲男人天堂| 亚洲最大福利视频| 欧美在线视频观看免费网站| 欧美日韩高清在线观看| 欧美做受高潮1| 欧美成人在线网站| 欧美网站在线观看| 自拍偷拍亚洲一区| 色偷偷888欧美精品久久久| 懂色aⅴ精品一区二区三区蜜月| 在线视频日本亚洲性| 宅男66日本亚洲欧美视频| 精品动漫一区二区| 欧美丝袜美女中出在线| 国产精品亚洲精品| 日韩电影中文字幕一区| 欧美在线一区二区三区四| 日韩在线观看免费全集电视剧网站| 26uuu久久噜噜噜噜| 久久精品99久久香蕉国产色戒| 久久激情视频免费观看| 韩国视频理论视频久久| 亚洲性视频网站| 国产97在线播放| 日本亚洲精品在线观看| 色哟哟亚洲精品一区二区|