站長資訊網
        最全最豐富的資訊網站

        還不會正則表達式?趕快看這篇!

        正則表達式是很多程序員,甚至是一些有了多年經驗的開發者薄弱的一項技能。大家都很多時候都會覺得正則表達式難記、難學、難用,但不可否認的是正則表達式是一項很重要的技能,所有我將學習和使用正則表達式時的關鍵點整理如下,供大家參考。

        不同語言中的正則表達式寫法有少許差異,本文將使用 Javascript 中的語法。

        什么是正則表達式?

        正則表達式(Regular Expression 或 Regex),是用于定義某種特定搜索模式的字符組合。正則表達式可用于匹配、查找和替換文本中的字符,進行輸入數據的驗證,查找英文單詞的拼寫錯誤等。

        調試工具

        下面列出了幾款優秀的在線調試工具,如果你想創建或者調試正則表達式可能會需要。個人比較偏好Regex101,regex101 支持在正則表達式的不同 flavor 之間切換、解釋你的正則表達式、顯示匹配信息、提供常用語法參考等功能,非常強大。

        Regex101

        還不會正則表達式?趕快看這篇!

        Regexr

        還不會正則表達式?趕快看這篇!

        Regexpal

        還不會正則表達式?趕快看這篇!

        開始

        在 Javascript 中,一個正則表達式以 / 開頭和結尾,所以簡單至 /hello regexp/ 就是一個正則表達式。

        Flags(標志符或修飾符)

        Flags 寫在結束的/之后,可以影響整個正則表達式的匹配行為。常見的 flags 有:

        g:全局匹配(global);正則表達式默認只會返回第一個匹配結果,使用標志符g則可以返回所有匹配i:忽略大小寫(case-insensitive);在匹配時忽略英文字母的大小寫m:多行匹配(multiline);將開始和結束字符(^和$)視為在多行上工作,即分別匹配每一行(由 nr 分割)的開始和結束,而不只是只匹配整個輸入字符串的最開始和最末尾處

        Flags 可以組合使用,如:

        還不會正則表達式?趕快看這篇!

        Character Sets(字符集合)

        用于匹配字符集合中的任意一個字符,常見的字符集有:

        [xyz]:匹配 "x""y"``"z"[^xyz]:補集,匹配除 "x" "y" "z"的其他字符[a-z]:匹配從 "a""z" 的任意字符[^a-n]:補集,匹配除 "a""n" 的其他字符[A-Z]:匹配從 "A""Z" 的任意字符[0-9]:匹配從 "0""9" 的任意數字

        比如匹配所有的字母和數字可以寫成:/[a-zA-Z0-9]/ 或者 /[a-z0-9]/i

        Quantifiers (量詞)

        在實際使用中,我們常常需要匹配同一類型的字符多次,比如匹配 11 位的手機號,我們不可能將 [0-9] 寫 11 遍,此時我們可以使用 Quantifiers 來實現重復匹配。

        {n}:匹配 n{n,m}:匹配 n-m{n,}:匹配 >=n?:匹配 0 || 1*:匹配 >=0 次,等價于 {0,}+:匹配 >=1 次,等價于 {1,}

        Metacharacters(元字符)

        在正則表達式中有一些具有特殊含義的字母,被稱為元字符,簡言之,元字符就是描述字符的字符,它用于對字符表達式的內容、轉換及各種操作信息進行描述。

        常見的元字符有:

        d:匹配任意數字,等價于 [0-9]D:匹配任意非數字字符;d 的補集w:匹配任意基本拉丁字母表中的字母和數字,以及下劃線;等價于 [A-Za-z0-9_]W:匹配任意非基本拉丁字母表中的字母和數字,以及下劃線;w 的補集s:匹配一個空白符,包括空格、制表符、換頁符、換行符和其他 Unicode 空格S:匹配一個非空白符;s的補集b:匹配一個零寬單詞邊界,如一個字母與一個空格之間;例如,/bno/ 匹配 "at noon" 中的 "no"/lyb/ 匹配 "possibly yesterday." 中的 "ly"B:匹配一個零寬非單詞邊界,如兩個字母之間或兩個空格之間;例如,/Bon/ 匹配 "at noon" 中的 "on"/yeB/ 匹配 "possibly yesterday." 中的 "ye"t:匹配一個水平制表符(tab)n:匹配一個換行符(newline)r:匹配一個回車符(carriage return)

        Special Characters (特殊字符)

        正則中存在一些特殊字符,它們不會按照字面意思進行匹配,而有特殊的意義,比如前文講過用于量詞的?*+。其他常見的特殊字符有:

        :轉義字符,可以將普通字符轉成特殊字符。比如 w;也可以將特殊字符轉成字面意思,比如 + 匹配 "+".:匹配任意單個字符,但是換行符除外:n, r, u2028u2029;在字符集中([.]),無特殊含義,即表示 '.' 的字面意思|:替換字符(alternate character),匹配 | 前或后的表達式。比如需要同時匹配 "bear""pear",可以使用 /(b|p)ear/ 或者 /bear|pear/;但是不能用 /b|pear/,該表達式只能匹配 "b""pear"^:匹配輸入的開始。比如,/^A/ 不匹配 "an Apple" 中的 "A",但匹配 "An apple" 中的 "A"$:匹配輸入的結尾。比如,/t$/ 不匹配 "eater" 中的 "t",但匹配 "eat" 中的 "t"^$ 在表單驗證時常需要使用,因為需要驗證從開始到結尾的一個完整輸入,而不是匹配輸入中的某一段

        Groups(分組)(xyz):捕獲分組(Capturing Group),匹配并捕獲匹配項;例如,/(foo)/ 匹配且捕獲 "foo bar." 中的 "foo"。被匹配的子字符串可以在結果數組的元素 [1], …, [n] 中找到,或在被定義的 RegExp 對象的屬性 $1, …, $9 中找到(?:xyz):非捕獲分組(Non-capturing Group),匹配但不會捕獲匹配項;匹配項不能再次被訪問到nn 是一個正整數,表示反向引用(back reference),指向正則表達式中第 n 個括號(從左開始數)中匹配的子字符串;例如,/apple(,)sorange1/ 匹配 "apple, orange, cherry, peach." 中的 "apple,orange,"

        Assertion(斷言)x(?=y):僅匹配被y跟隨的x;例如,/bruce(?=wayne)/,如果"bruce"后面跟著wayne,則匹配之。/bruce(?=wayne|banner)/ ,如果"bruce"后面跟著"wayne"或者banner,則匹配之。但是,"wayne""banner" 都不會在匹配結果中出現x(?!y):僅匹配不被y跟隨的x;例如,/d+(?!.)/ 只會匹配不被 "." 跟隨的數字。

        /d+(?!.)/.exec('3.141')` 匹配 `"141"`,而不是 `"3.141"

        最后,推薦大家使用Fundebug,一款很好用的 BUG 監控工具~

        應用

        上面羅列出了這么多正則表達式的語法和規則,可以在一定程度上幫助我們分析和理解一段正則表達式的作用,但是如何將這些規則組合并創造出有特定作用的表達式還需要我們自己多加練習,下面舉幾個例子來說明運用這些規則。

        1. 匹配手機號碼

        我們先從比較簡單的匹配手機號碼開始。目前國內的手機號碼是1(3/4/5/7/8)開頭的 11 位數字,因此手機號碼的正則可以分解為以下幾部分:

        1 開頭:/^1/第 2 位為3、4、5、7、8中的一個:/[34578]//(3|4|5|7|8)/剩余 3-11 位均為數字,并以數字結尾:/d{9}$/

        組合起來即為 /^1[34578]d{9}$//^1(3|4|5|7|8)d{9}$/,因為使用捕獲括號存在性能損失,所以推薦使用第一種寫法。

        2. 匹配電子郵件

        標準的電子郵件組成為 <yourname>@<domain>.<extension><optional-extension>

        每部分的格式標準為(進行了相應的簡化,主要為展示如何書寫正則):

        yourname:任意英文字母(a-z/A-Z)、數字(0-9)、下劃線(_)、英文句點(.)、連字符(-),長度大于 0domain:任意英文字母(a-z/A-Z)、數字(0-9)、連字符(-),長度大于 0extension:任意英文字母(a-z/A-Z),長度 2-8optional-extension:"."開頭,后面跟任意英文字母(a-z/A-Z),長度 2-8,可選

        每部分的正則表達式為:

        yourname:/[a-zd._-]+/domain:/[a-zd-]+/extension: /[a-z]{2,8}/optional-extension:/(.[a-z]{2,8})?/

        組合起來形成最后的正則表達式:/^([a-zd._-]+)@([a-zd-]+).([a-z]{2,8})(.[a-z]{2,8})?$/;為了增加可讀性可以將每部分用"()"包起來,并不要忘記起始和結束符 ^$

        結語

        今天關于正則表達式的普及就先到這兒,希望對大家以后寫正則能有一點幫助。關于本文中沒有涉及到的知識可以參考以下鏈接:

        Wikipedia – Regular ExpressionMDN – Regular ExpressionMicrosoft – Regular Expression ReferenceW3schools – Regexp

        好了,本文就給大家介紹到這里,希望對大家有所幫助!

        贊(0)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 国产精品内射视频免费| 国产精品一区三区| 国产精品日韩欧美在线第3页| 久久久久成人精品无码中文字幕| 精品国产亚洲一区二区在线观看| 国产精品爽爽va在线观看网站| 午夜精品久久久久久久| 欧美成人精品欧美一级乱黄一区二区精品在线 | 国产成人精品怡红院在线观看| 精品无码av一区二区三区| 亚洲欧洲自拍拍偷精品 美利坚| 国产精品区AV一区二区| 欧美精品一区二区三区视频| 69久久精品无码一区二区| 久久精品人人做人人妻人人玩| 亚洲精品成人无限看| 免费精品国自产拍在线播放| 精品国产欧美一区二区三区成人| 四虎永久在线精品国产免费| laowang在线精品视频| 国产精品国产亚洲精品看不卡| 人人妻人人澡人人爽欧美精品 | 精品国产青草久久久久福利| 国产精品狼人久久久久影院 | 精品国产AV一区二区三区| 无码国产乱人伦偷精品视频| 亚洲中文字幕久久精品无码APP| 日韩精品一二三四区| 日韩经典精品无码一区| 无码人妻一区二区三区精品视频| 久热这里只有精品99国产6| 久久成人精品| 欧美亚洲另类精品第一页| 麻豆精品三级全部视频 | 久久国产精品无码一区二区三区 | 国产精品亚洲高清一区二区| 国产午夜精品久久久久九九| 精品国产一区二区三区久久蜜臀| 国产偷国产偷高清精品| 欧美久久亚洲精品| 一级做a爰黑人又硬又粗免费看51社区国产精品视 |