亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > C# > 正文

淺談C#中正則表達式的使用

2020-01-24 00:53:11
字體:
來源:轉載
供稿:網友

目前為止,許多編程語言和工具都包含對正則表達式的支持,C#也不例外,C#基礎類庫中包含有一個命名空間(System.Text.RegularExpressions)和一系列可以充分發揮規則表達式威力的類(Regex、Match、Group等)。那么,什么是正則表達式,怎么定義正則表達式呢?

一、正則表達式基礎

什么是正則表達式

在編寫字符串的處理程序時,經常會有查找符合某些復雜規則的字符串的需要。正則表達式就是用于描述這些規則的工具。換句話說,正則表達式就是記錄文本規則的代碼。

通常,我們在使用WINDOWS查找文件時,會使用通配符(*和?)。如果你想查找某個目錄下的所有Word文檔時,你就可以使用*.doc進行查找,在這里,*就被解釋為任意字符串。和通配符類似,正則表達式也是用來進行文本匹配的工具,只不過比起通配符,它能更精確地描述你的需求――當然,代價就是更復雜。

一個簡單的例子――驗證電話號碼

學習正則表達式的最好方法是從例子開始,下面我們從驗證電話號碼開始,一步一步的了解正則表達式。

在我們國家,電話號碼(如:0379-65624150)通常包含3到4為以0開頭的區號和一個7或8為的號碼,中間通常以連字符'-'隔開。在這個例子中,首先我們要介紹一個元字符/d,它用來匹配一個0到9的數字。這個正則表達式可以寫成:^0/d{2,3}-/d{7,8}$

我們來對他進行分析,0匹配數字“0”,/d匹配一個數字,{2,3}表示重復2到3次,-只匹配”-”自身,接下來的/d同樣匹配一個數字,而 {7,8}則表示重復7到8次。當然,電話號碼還可以寫成 (0379)65624150,這里就交給讀者完成。

元字符

在上面的例子中,我們接觸到了一個元字符/d,正如你所想的,正則表達式還有很多像/d一樣的元字符,下表列出了一些常用的元字符:

元字符

說明

.

匹配除換行符以外的任意字符

/b

匹配單詞的開始或結束

/d

匹配數字

/s

匹配任意的空白符

/w

匹配字母或數字或下劃線或漢字

^

匹配字符串的開始

$

匹配字符串的結束

表1、常用的元字符

 轉義字符

如果你想查找元字符本身的話,比如你查找.,或者*,就出現了問題:你沒辦法指定它們,因為它們會被解釋成別的意思。這時你就得使用/來取消這些字符的特殊意義。因此,你應該使用/.和/*。當然,要查找/本身,你也得用//.

例如:unibetter/.com匹配unibetter.com,C://Windows匹配C:/Windows。

限定符

限定符又叫重復描述字符,表示一個字符要出現的次數。比如我們在匹配電話號碼時使用的{3,4}就表示出現3到4次。常用的限定符有:

限定符

說明

*

重復零次或更多次

+

重復一次或更多次

?

重復零次或一次

{n}

重復n次

{n,}

重復n次或更多次

{n,m}

重復n到m次

                                               表2、常用的限定符

二、.NET中正則表達式的支持

System.Text.RegularExpressions 命名空間包含一些類,這些類提供對 .NET Framework 正則表達式引擎的訪問。該命名空間提供正則表達式功能,可以從運行在 Microsoft .NET Framework 內的任何平臺或語言中使用該功能。

1、在C#中使用正則表達式

在了解了C#中支持正則表達式的類后,我們一起來將上面提到的驗證電話號碼的正則表達式寫入C#代碼中,實現電話號碼的驗證。

第一步,建立一個名為SimpleCheckPhoneNumber的Windows項目。

第二步,引入System.Text.RegularExpressions命名空間。

第三步,寫出正則表達式。這里的正則表達式就是上面的驗證號碼的字符串。由于上面的字符串只能驗證用連字符連接區號和號碼的方式的電話號碼,所以我們做了一些修改:0/d{2,3}-/d{7,8}|/(0/d{2,3}/)/d{7,8}。在這個表達式中,| 號面的一部分是我們上面提到過的,后面一部分是用來驗證(0379)65624150這種電話號碼寫法的。由于 (  和  ) 也是元字符,所以要用轉義字符。| 表示分支匹配,要么匹配前面的一部分,要么匹配后面的一部分。

第四步,正則表達式構造一個Regex類。

第五步,使用Regex類的IsMatch方法驗證匹配。Regex類的IsMatch()方法返回一個bool值,如果有匹配項,返回true,否則返回false。

 三、正則表達式進階

分組

在匹配電話號碼的時候,我們已經用到過重復單個字符。下面我們來了解如何使用分組來匹配一個IP地址。

眾所周知,IP地址是四段點分十進制的字符串表示的。所以,我們可以通過地址的分組,來進行匹配。首先,我們來匹配第一段:2[0-4]/d|25[0-5]|[01]?/d/d? 這段正則表達式可以匹配IP地址的一段數字。2[0-4]/d 匹配以2開頭,十位為0到4,個位為任何數字的三位字段,25[0-5] 匹配以25 開頭,個位為0到5 的三位字段,[01]?/d/d? 匹配任何以1者0頭,個位和十位為任何數子的字段。? 表示出現零次或一次。所以, [01] 和 最后一個 /d 都可以不出現,如果我們再向這個字符串后面添加一個 /. 來匹配 . 就可以劃分一個段了?,F在,我們把 2[0-4]/d|25[0-5]|[01]?/d/d?/. 當做一個分組,就可以寫成 (2[0-4]/d|25[0-5]|[01]?/d/d?/.) 。接下來我們就來使用這個分組。將這個分組重復兩次,然后,再使用 2[0-4]/d|25[0-5]|[01]?/d/d? 就可以了。完整的正則表達式為: (2[0-4]/d|25[0-5]|[01]?/d/d?/.){3}2[0-4]/d|25[0-5]|[01]?/d/d?

 后向引用

在我們了解分組以后,我們就可以使用后向引用了。所謂后向引用,就是使用前面捕獲的結果,對后面的字符進行匹配。多用于匹配重復字符。比如匹配 go go 這樣的重復字符。我們就可以使用 (go) /1來進行匹配。

默認情況下,每個分組會自動擁有一個組號,規則是:從左向右,以分組的左括號為標志,第一個出現的分組的組號為1,第二個為2,以此類推。當然,你也可以自己指定子表達式的組名。要指定一個子表達式的組名,請使用這樣的語法:(?<Word>/w+)(或者把尖括號換成'也行:(?'Word'/w+)),這樣就把/w+的組名指定為Word了。要反向引用這個分組捕獲的內容,你可以使用/k<Word>,所以上一個例子也可以寫成這樣:/b(?<Word>/w+)/b/s+/k<Word>/b。

自定義組名還有另外一個好處,在我們的C#程序中,如果需要得到分組的值,我們就可以很明確的使用我們定義的分組的名字來得到,而不必使用下標。

當我們并不想使用后向引用時,是不需要捕獲組記憶任何東西的,這種情況下就可以利用(?:nocapture)語法來主動地告訴正則表達式引擎,不要把圓括號的內容當作捕獲組,以便提高效率。

 零寬斷言

在前面的元字符介紹中,我們已經知道了有這樣一類字符,可以匹配一句話的開始、結束(^ $)或者匹配一個單詞的開始、結束(/b)。這些元字符只匹配一個位置,指定這個位置滿足一定的條件,而不是匹配某些字符,因此,它們被成為 零寬斷言。所謂零寬,指的是它們不與任何字符相匹配,而匹配一個位置;所謂斷言,指的是一個判斷。正則表達式中只有當斷言為真時才會繼續進行匹配。

在有些時候,我們精確的匹配一個位置,而不僅僅是句子或者單詞,這就需要我們自己寫出斷言來進行匹配。下面是斷言的語法:

斷言語法

說明

(?=pattern)

前向肯定斷言,匹配pattern前面的位置

(?!pattern)

前向否定斷言,匹配后面不是pattern的位置

(?<=pattern)

后向肯定斷言,匹配pattern后面的位置

(?<!pattern)

后向否定斷言,匹配前面不是pattern的位置

表3、斷言的語法及說明

很難理解嗎?我們來看一個例子。

有一個標簽:<book>,我們想要得到標簽<book>的標簽名(book),這個時候,我們就可以使用斷言來處理??聪旅孢@個表達式:(?<=/<)(?<tag>/w*)(?=/>) ,使用這個表達式,可以匹配< 和 >之間的字符,也就是這里的book。使用斷言還還可以寫出更加復雜的表達式,這里就不再舉例了。

還有一點非常重要,就是斷言語法所使用的圓括號并不作為捕獲組,所以不能使用編號或命名來對它進行引用。

 貪婪與懶惰

當正則表達式中包含能接受重復的限定符時,通常的行為是(在使整個表達式能得到匹配的前提下)匹配盡可能多的字符。來看一下這個表達式:a/w*b ,用它來匹配字符串 aabab 時,得到的匹配結果是 aabab 。這種匹配被稱為貪婪匹配。

有些時候,我們希望讓它盡可能的少重復,即用上面的例子得到的匹配結果是 aab,這時我們就要使用懶惰匹配。懶惰匹配需要在重復限定符的后面添加一個 ? 符號,上面的表達式就可以寫成:a/w*?b 我們再來匹配字符串 aabab時,得到的匹配結果是 aab 和 ab 。

也許這個時候你要問,ab 比aab重復次數更少,為什么不先匹配ab呢?其實在正則表達式中還有比貪婪/懶惰優先級更高的規則:最先開始的匹配擁有最高的優先權――The match that begins earliest wins。

 注釋

語法:(?#comment)

   例如:2[0-4]/d(?#200-249)|25[0-5](?#250-255)|[01]?/d/d?(?#0-199)

   注意:如果使用注釋,則需要格外注意不要在注釋的小括號前面出現空格、換行符等一些字符,如果可以忽略這些字符,則最好使用“忽略模式里的空白符”選項,即C#中RegexOptions枚舉的IgnorePatternWhitespace選項(C#中的RegexOptions枚舉下面將會提到)。

 C#中的處理選項

在C#中,可以使用RegexOptions 枚舉來選擇C#對正則表達式的處理方式。下面是MSDN中RegexOptions 枚舉的成員介紹:

 C#中Capture類、Group類、Match類

Capture類:表示單個子表達式捕獲中的結果。Capture類表示單個成功捕獲中的一個子字符串。該類沒有公共構造函數,可以從Group類或者Match類中得到一個Capture類的對象集合。Capture類有三個常用屬性,分別是Index、Length和Value。Index表示捕獲的子字符串的第一個字符的位置。Length表示捕獲的子字符串的長度,Value表示捕獲的子字符串。

Group類:表示正則表達式中分組的信息。該類提供了對分組匹配的正則表達式的支持。該類沒有公共構造函數。可以從Match類中得到一個Group類的集合。如果正則表達式中的分組已命名,則可以使用名字對其進行訪問,如果沒有命名,則可以采用下標訪問。注意:每一個Match的Groups集合中的第0個元素(Groups[0])都是這個Match捕獲的字符串,也是Capture的Value。

Match類:表示單個正則表達式匹配的結果。該類同樣沒有公共構造函數,可以從Regex類的Match()方法得到該類的一個實例,也可以使用Regex類的Matches()方法得到給類的一個集合。

這三個類都能表示單個正則表達式匹配的結果,但Match類得到的更為詳細,包含捕獲和分組信息。所以,Match類在這個三個類中是最常用的。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持武林網。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
亚洲第一精品久久忘忧草社区| 日韩国产精品一区| 国内外成人免费激情在线视频| 国产午夜精品美女视频明星a级| 精品美女久久久久久免费| 亚洲国语精品自产拍在线观看| 美女精品久久久| 欧美日韩亚洲视频| 亚洲精品小视频在线观看| 亚洲一区中文字幕在线观看| 亚洲国产91色在线| 91精品国产高清自在线看超| 日韩av理论片| 国产精品久久久久久久久久久久久久| 欧美电影电视剧在线观看| 久久成人精品一区二区三区| 亚洲天堂影视av| 欧美在线国产精品| 日韩精品免费一线在线观看| 欧美精品激情blacked18| 亚洲国产精品中文| 色妞在线综合亚洲欧美| 欧美精品在线观看91| 国产视频精品自拍| 欧美天天综合色影久久精品| 久久影院中文字幕| 久久69精品久久久久久国产越南| 日韩av免费在线| 精品福利视频导航| 精品亚洲va在线va天堂资源站| 日韩亚洲欧美中文高清在线| 欧美丝袜一区二区三区| 精品久久在线播放| 岛国视频午夜一区免费在线观看| 色婷婷久久av| 久久精品国产2020观看福利| 亚洲人精品午夜在线观看| 性色av一区二区三区红粉影视| 国产日韩欧美一二三区| 中文字幕不卡在线视频极品| 国产97在线|日韩| 亚洲午夜精品久久久久久久久久久久| 欧美性少妇18aaaa视频| 亚洲伊人成综合成人网| 国内免费久久久久久久久久久| 久久国产精品久久久久久| 2024亚洲男人天堂| 色在人av网站天堂精品| 国产这里只有精品| 热门国产精品亚洲第一区在线| 黑人与娇小精品av专区| 亚洲片在线观看| 国产乱肥老妇国产一区二| 亚洲色图色老头| 欧美性极品xxxx娇小| 亚洲欧美制服中文字幕| 欧美大片欧美激情性色a∨久久| 精品久久久久久久久久久久| 日韩欧美有码在线| 日韩av理论片| 国内精久久久久久久久久人| 日韩一区在线视频| 国产亚洲欧美aaaa| 国产精品亚洲一区二区三区| 精品五月天久久| 国产精品无av码在线观看| 亚洲性线免费观看视频成熟| 国产精品久久久久久中文字| 青青草成人在线| 中文字幕日韩欧美在线视频| 91色琪琪电影亚洲精品久久| 亚洲欧美三级伦理| 国语自产精品视频在线看抢先版图片| 久久精品99无色码中文字幕| 成人中文字幕+乱码+中文字幕| 国产精品1区2区在线观看| 亚洲最大福利视频网站| 国产精品精品视频一区二区三区| 亚洲视频在线播放| 亚洲色图13p| 亚洲高清在线观看| 日韩欧美国产高清91| 欧美日韩爱爱视频| 色无极影院亚洲| 中文字幕日韩综合av| 性日韩欧美在线视频| 欧美小视频在线观看| 久久久国产精品免费| 国产色婷婷国产综合在线理论片a| 国产精品三级久久久久久电影| 国产精品扒开腿爽爽爽视频| 亚洲福利视频免费观看| 国产精品视频播放| 日韩在线播放一区| 欧美激情一区二区三级高清视频| 国产日韩精品入口| 欧美激情视频免费观看| 按摩亚洲人久久| 国产精品亚洲片夜色在线| 亚洲天堂影视av| 在线a欧美视频| 狠狠躁夜夜躁人人爽超碰91| 日韩亚洲欧美中文高清在线| 国产精品福利久久久| 欧美性视频网站| 国产精品h片在线播放| 8x拔播拔播x8国产精品| 在线视频一区二区| 亚洲人成网7777777国产| 国产精品99久久久久久久久久久久| 久久在线免费观看视频| 亚洲国产精品999| 久久99亚洲精品| 91成人天堂久久成人| 另类天堂视频在线观看| 成人激情在线观看| 97国产精品视频| 欧美电影免费观看电视剧大全| 狠狠色狠狠色综合日日小说| 亚洲一区制服诱惑| 欧美在线亚洲一区| 国产精品视频播放| 国产欧美精品一区二区三区介绍| 亚洲性线免费观看视频成熟| 亚洲国产另类久久精品| 亚洲色图狂野欧美| 欧美巨猛xxxx猛交黑人97人| 日本国产精品视频| 欧美一区二区色| 最近2019年中文视频免费在线观看| 欧美极品xxxx| 久久综合久久八八| 中文字幕欧美日韩| 久久久亚洲影院你懂的| 成人久久18免费网站图片| 亚洲女在线观看| 欧美一区二区三区四区在线| 国产男女猛烈无遮挡91| 久久视频中文字幕| 丝袜亚洲欧美日韩综合| 国产精品黄色影片导航在线观看| 国产一区二区黄| 国产z一区二区三区| 亚洲精品视频在线观看视频| 热久久免费国产视频| 日韩av在线免费| 国产一区二区欧美日韩| 456亚洲影院| 国产日韩换脸av一区在线观看| 国产精品影片在线观看| 51视频国产精品一区二区| 91精品国产网站| 中文字幕9999| 亚洲免费视频观看| 久久久成人av| 亚洲国产成人久久| 日韩欧美在线视频| 国产精品久久久久久久app| 日韩网站免费观看| 精品香蕉一区二区三区| 91精品国产综合久久香蕉的用户体验| 日本道色综合久久影院| 欧美最顶级的aⅴ艳星| 亚洲一区二区久久|