站長資訊網
        最全最豐富的資訊網站

        Grep(Regex)中的正則表達式

        grep是Linux中用于文本處理的最有用和功能最強大的命令之一。 grep在一個或多個輸入文件中搜索與正則表達式匹配的行,并將每條匹配的行寫入標準輸出。

        在本文中,我們將探討在grep的GNU版本中如何使用正則表達式的基礎,大多數Linux操作系統默認情況下都提供此功能。

        Grep正則表達式

        正則表達式或正則表達式是與一組字符串匹配的模式。模式由運算符,構造文字字符和元字符組成,它們具有特殊的含義。 GNU grep支持三種正則表達式語法,Basic,Extended和Perl兼容。

        最簡單的形式是,當沒有給出正則表達式類型時,grep會將搜索模式解釋為基本正則表達式。要將模式解釋為擴展的正則表達式,請使用-E(或–extended-regexp)選項。

        在GNU的grep實現中,基本正則表達式和擴展正則表達式語法之間沒有功能上的區別。唯一的區別是,在基本正則表達式中,元字符?,+,{,|,(和)被解釋為文字字符。為了在使用基本正則表達式時保持元字符的特殊含義,必須使用反斜杠()對字符進行轉義。稍后我們將解釋這些和其他元字符的含義。

        通常,您應始終將正則表達式括在單引號中,以避免shell解釋和擴展元字符。

        文字匹配

        grep命令最基本的用法是在文件中搜索文字字符或一系列字符。例如,要在/ etc / passwd文件中顯示所有包含字符串“ bash”的行,您可以運行以下命令:

        [linuxidc@localhost www.linuxidc.com]$ grep bash /etc/passwd

        輸出應如下所示:

        root:x:0:0:root:/root:/bin/bash
        linuxidc:x:1000:1000:linuxidc:/home/linuxidc:/bin/bash

        Grep(Regex)中的正則表達式

        在此示例中,字符串“ bash”是由四個文字字符組成的基本正則表達式。 這告訴grep搜索帶有緊隨其后的“ a”,“ s”和“ h”的字符串“ b”。

        缺省情況下,grep命令區分大小寫。 這意味著將大寫和小寫字符視為不同的字符。 要在搜索時忽略大小寫,請使用-i選項(或–ignore-case)。

        請務必注意,grep會將搜索模式作為字符串而不是單詞來查找。 因此,如果您要搜索“ gnu”,則grep還將打印“ gnu”嵌入較大字詞(例如“ cygnus”或“ magnum”)的行。

        如果搜索字符串包含空格,則需要將其用單引號或雙引號引起來:

        $grep “Gnome Display Manager” /etc/passwd

        錨定Anchoring

        Anchoring是元字符,可讓您指定必須在該行中找到匹配項的位置。

        ^(脫字符號)符號與一行開頭的空字符串匹配。 在以下示例中,僅當字符串“ linux”出現在行的開頭時才匹配。

        $grep ‘^linux’ file.txt

        $(美元)符號與行首的空字符串匹配。 要查找以字符串“ linux”結尾的行,可以使用:

        $grep ‘linux$’ file.txt

        您還可以使用兩個錨點構造一個正則表達式。 例如,要查找僅包含“ linux”的行,請運行:

        $grep ‘^linux$’ file.txt

        另一個有用的示例是匹配所有空行的^ $模式。

        匹配單個字符

        .(點)符號是與任何單個字符匹配的元字符。 例如,要匹配以“ kan”開頭,然后有兩個字符并以字符串“ roo”結尾的任何內容,則可以使用以下模式:

        $grep ‘kan..roo’ file.txt

        括號表達式

        方括號表達式允許將一組字符括在方括號[]中來匹配一組字符。 例如,找到包含“ accept”或“ accent”的行,可以使用以下表達式:

        $grep ‘acce[np]t’ file.txt

        如果方括號內的第一個字符是插入符號^,則它匹配方括號中未包含的任何單個字符。 以下模式將匹配以“ co”開頭的字符串的任意組合,后接除“ l”之后為“ la”的任何字母(例如“ coca”,“ cobalt”等),但不匹配包含“ cola”的行 ”:

        $grep ‘co[^l]a’ file.txt

        您可以在方括號內指定一系列字符,而不是一個一個地放置字符。 通過指定以連字符分隔的范圍的第一個和最后一個字符來構造范圍表達式。 例如,[a-a]等效于[abcde],[1-3]等效于[123]。

        以下表達式匹配以大寫字母開頭的每一行:

        $grep ‘^[A-Z]’ file.txt

        grep還支持括號中預定義的字符類。 下表顯示了一些最常見的字符類:

        Quantifier Character Classes
        [:alnum:] 字母數字字符。
        [:alpha:] 字母字符。
        [:blank:] 空格和制表符。
        [:digit:] 數字。
        [:lower:] 小寫字母。
        [:upper:] 大寫字母。

        有關所有字符類別的完整列表,請參閱Grep手冊。

        量詞

        量詞Quantifier允許您指定要出現的匹配項必須出現的項數。 下表顯示了GNU grep支持的量詞:

        Quantifier 描述
        * 匹配上一項零次或多次。
        ? 匹配上一項零或一次。
        + 將上一項匹配一次或多次。
        {n} 將前一項精確匹配n次。
        {n,} 至少匹配n個項目。
        {,m} 最多匹配m次以上項。
        {n,m} 將前一項匹配n至m次。

        *(星號)字符與前面的項目匹配零次或多次。 以下將匹配“right”,“sright”,“ssright”等等。

        $grep ‘s*right’

        下面是更高級的模式,它匹配所有以大寫字母開頭,以句點或逗號結尾的行。 .* 正則表達式匹配任意數量的任何字符:

        $grep -E ‘^[A-Z].*[.,]$’ file.txt

        ? (問號)字符使前一項為可選,并且只能匹配一次。 以下將同時匹配“bright”和“right”。 ? 字符以反斜杠轉義,因為我們使用的是基本正則表達式:

        $grep ‘b?right’ file.txt

        下面是使用擴展正則表達式的同一個正則表達式:

        $grep -E ‘b?right’ file.txt

        +(加號)字符與前面的項目匹配一次或多次。 以下將匹配“sright”和“ssright”,但不匹配“right”:

        $grep -E ‘s+right’ file.txt

        大括號字符{}使您可以指定確切的數字,上限或下限或發生匹配必須發生的范圍。

        以下內容匹配3到9位之間的所有整數:

        $grep -E ‘[[:digit:]]{3,9}’ file.txt

        交替Alternation

        交替是一個簡單的“或”。替換操作符| (pipe)允許您指定不同的可能匹配,可以是文字字符串或表達式集。該操作符在所有正則表達式操作符中優先級最低。

        在下面的例子中,我們搜索Nginx日志錯誤文件中出現的所有單詞fatal, error和critical:

        $grep ‘fatal|error|critical’ /var/log/nginx/error.log

        如果使用擴展正則表達式,則不應轉義運算符|,如下所示:

        $grep -E ‘fatal|error|critical’ /var/log/nginx/error.log

        分組

        分組是正則表達式的一項功能,可讓您將模式分組在一起并將其作為一項引用。 使用括號()創建組。

        使用基本正則表達式時,必須用反斜杠()對括號進行轉義。

        下面的示例同時匹配“ fearless”和“ less”。 ? 量詞使(fear)組成為可選的:

        $grep -E ‘(fear)?less’ file.txt

        反斜杠特殊表達式

        GNU grep包含幾個元字符,由反斜杠和常規字符組成。 下表顯示了一些最常見的特殊反斜杠表達式:

        Expression Description
        b 單詞鎖定符
        < 在單詞開頭匹配一個空字符串。
        > 在單詞末尾匹配一個空字符串。
        w 匹配一個單詞。
        s 匹配一個空格。

        以下模式將匹配單獨的單詞“ abject”和“ object”。 如果嵌入較大的單詞,則不會匹配這些單詞:

        $grep ‘b[ao]bjectb’ file.txt

        總結

        正則表達式用于文本編輯器,編程語言和命令行工具,例如grep,sed和awk。 在搜索文本文件,編寫腳本或過濾命令輸出時,了解如何構造正則表達式將非常有幫助。

        如果您有任何問題或反饋,請隨時發表評論。

        贊(1)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 中文字幕日韩精品无码内射 | 国产精品久久久久9999| 91精品国产高清久久久久久国产嫩草 | 久久亚洲国产成人精品性色| 国产成人精品综合久久久| 国产成人精品无码播放| 亚洲精品无码专区久久久| 精品久久久久久久中文字幕 | 日韩人妻无码精品一专区| 久久久久久久久久久免费精品| 87国产私拍福利精品视频| 97精品国产福利一区二区三区| 亚洲精品乱码久久久久久按摩| 老年人精品视频在线| 国产精品久久久天天影视香蕉 | 亚洲国产91精品无码专区| 久久久久国产精品嫩草影院 | 久久99精品久久久久婷婷| 在线观看91精品国产网站| 日韩欧美国产精品第一页不卡| 国产欧美在线观看精品一区二区| 色播精品免费小视频| 久久91精品国产91久久小草| 99精品国产一区二区三区| 精品久久久久久无码专区| 奇米影视7777久久精品| 午夜精品射精入后重之免费观看| 亚洲精品一级无码鲁丝片| 日本精品自产拍在线观看中文 | 亚洲AV无码成人网站久久精品大 | 久久精品免费大片国产大片| 精品成人一区二区三区四区| 国产欧美精品一区二区色综合| 国产精品黄页免费高清在线观看| 国产精品福利区一区二区三区四区| 国产高清在线精品一区二区三区| 国产精品国产三级国产a| 黑人无码精品又粗又大又长| 久久激情亚洲精品无码?V| 欧美亚洲成人精品| 亚洲一级Av无码毛片久久精品|