站長資訊網
        最全最豐富的資訊網站

        正則表達式匹配不包含某些字符串的技巧

        經常我們會遇到想找出不包含某個字符串的文本,程序員最容易想到的是在正則表達式里使用,^(hede)來過濾”hede”字串,但這種寫法是錯誤的。我們可以這樣寫:[^hede],但這樣的正則表達式完全是另外一個意思,它的意思是字符串里不能包含‘h’,‘e’,‘d’三個但字符。那什么樣的正則表達式能過濾出不包含完整“hello”字串的信息呢?

        事實上,說正則表達式里不支持逆向匹配并不是百分之百的正確。就像這個問題,我們就可以使用否定式查找來模擬出逆向匹配,從而解決我們的問題:

        復制代碼 代碼如下:
        ^((?!hede).)*$

        上面這個表達式就能過濾出不包含‘hede’字串的信息。我上面也說了,這種寫法并不是正則表達式“擅長”的用法,但它是可以這樣用的。

        解釋

        一個字符串是由n個字符組成的。在每個字符之前和之后,都有一個空字符。這樣,一個由n個字符組成的字符串就有n+1個空字符串。我們來看一下“ABhedeCD”這個字符串:

        正則表達式匹配不包含某些字符串的技巧

        所有的e編號的位置都是空字符。表達式(?!hede).會往前查找,看看前面是不是沒有“hede”字串,如果沒有(是其它字符),那么.(點號)就會匹配這些其它字符。這種正則表達式的“查找”也叫做“zero-width-assertions”(零寬度斷言),因為它不會捕獲任何的字符,只是判斷。

        在上面的例子里,每個空字符都會檢查其前面的字符串是否不是‘hede’,如果不是,這.(點號)就是匹配捕捉這個字符。表達式(?!hede).只執行一次,所以,我們將這個表達式用括號包裹成組(group),然后用*(星號)修飾――匹配0次或多次:

        復制代碼 代碼如下:
        ((?!hede).)*。

        你可以理解,正則表達式((?!hede).)*匹配字符串”ABhedeCD”的結果false,因為在e3位置,(?!hede)匹配不合格,它之前有”hede”字符串,也就是包含了指定的字符串。

        在正則表達式里, ?! 是否定式向前查找,它幫我們解決了字符串“不包含”匹配的問題。

        以下是一些補充:

        分享下php生成隨機數的三種方法,生成1-10之間的不重復隨機數,php生成不重復隨機數的例子,需要的朋友參考下。

        在hacker news上看到regex golf,幾道很有趣的正則表達式的題,有的需要用到不匹配這種匹配,比如需要匹配不包含某個單詞的串。

        開始正題之前,先來看看正則表達式的語法:

        [abc] a或b或c . 任意單個字符 a? 零個或一個a
        [^abc] 任意不是abc的字符 s 空格 a* 零個或多個a
        [a-z] a-z的任意字符 S 非空格 a+ 一個或多個a
        [a-zA-Z] a-z或A-Z d 任意數字 a{n} 正好出現n次a
        ^ 一行開頭 D 任意非數字 a{n,} 至少出現n次a
        $ 一行末尾 w 任意字母數字或下劃線 a{n,m} 出現n-m次a
        (…) 括號用于分組 W 任意非字母數字或下劃線 a*? 零個或多個a(非貪婪)
        (a|b) a或b b 單詞邊界 (a)…1 引用分組
        (?=a) 前面有a (?!a) 前面沒有a B 非單詞邊界

        正則表達式中有(?=a)和(?!a)來表示我們是否需要匹配某個東西。

        所以,有需要不匹配某樣內容時,就可以用(?!a)了。比如要匹配不含hello的字符串就可以這樣寫。

        復制代碼 代碼如下:
        ^(?!.*hello)

        這里.*用來表示hello之前可能有其他的字符,為什么還要加^呢,因為如果不加的話,可能匹配到h之后的這個位置上了。

        現在就可以解決regex golf上的abba這道題了。
        這道題是去匹配不含abba這種形式的單詞,比如abba,anallagmatic就不應該匹配上。

        正則表達式代碼:

        復制代碼 代碼如下:
        ^(?!.*(.)(.)21)

        然后利用不匹配,還可以解決prime這道題,這道題匹配有素數個x的串,先看正則。
         

        復制代碼 代碼如下:
        ^(?!(xx+)1+$)

        (xx+)是匹配2個及2個以上的x,(xx+)1+就是匹配重復出現2個及以上的串,所以(xx+)1+就表示了那些非素數的串,那么素數串就是除去這些非素數串,即是以上的正則表達式了。

        PS:關于正則,本站還提供了2款非常簡便實用的正則測試工具供大家使用:

        JavaScript正則表達式在線測試工具:
        http://tools.jb51.net/regex/javascript

        正則表達式在線生成工具:
        http://tools.jb51.net/regex/create_reg

        贊(0)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 99re这里只有精品热久久 | 精品人妻中文字幕有码在线 | 国产精品一在线观看| 日本五区在线不卡精品| 2024最新国产精品一区| 国产成人精品无码一区二区| 午夜在线视频91精品| 国产精品内射婷婷一级二| 国产精品一区二区久久| 国产成人精品电影在线观看| 日韩精品无码一区二区三区| 手机日韩精品视频在线看网站| 国产精品天干天干在线综合| 欧美精品国产精品| 91精品最新国内在线播放| 人妻精品久久久久中文字幕一冢本 | 国产精品久久久久影视不卡| 乱色精品无码一区二区国产盗| 欧美精品一区二区三区免费观看| 国产精品亚洲欧美大片在线观看 | 一区二区国产精品| 亚洲精品国产自在久久| 久久青青草原精品国产不卡| 国产精品美女网站| 国产色精品vr一区区三区| 国产精品视频全国免费观看| 国产69精品久久久久9999| 中文字幕精品视频| 夜色www国产精品资源站| 777国产盗摄偷窥精品0OOO| 欧美一区二区精品| 高清在线国产午夜精品| 国产欧美精品区一区二区三区| 国产精品成人无码久久久久久| 最新国产精品亚洲| 国产精品一区二区av不卡| 精品水蜜桃久久久久久久| 久久久久久久亚洲精品| 亚洲欧美日韩国产成人精品影院| 一区二区国产精品| 精品无码国产污污污免费网站|