站長資訊網
        最全最豐富的資訊網站

        python 正則表達式 反斜杠(/)的麻煩和陷阱

        要匹配字符串中1個反斜杠應該怎么寫正則表達式?”\”,這樣行嗎?試試就知道了,re模塊拋異常了,因為”\”就是一個反斜杠,對于正則表達式解析器來說,是一個轉義字符,但是后面啥也沒有,自然就報錯了,”\”三個肯定是不行的,試試四個”\\”,完美匹配。

        復制代碼 代碼如下:
        import re
        re_str_patt = “\\”
        reObj = re.compile(re_str_patt)
        str_test = “abc\cd\hh”
        print reObj.findall(str_test)

        輸出:[‘\’, ‘\’]

        這里要這么理解,首先第一重轉換是字符串自身的轉義,那么”\\”,實際上就是表示兩個反斜杠(兩個字符),然后傳入正則表達式解析器,因為反斜杠依然是轉義字符,那么進行第二重轉換,兩個反斜杠就代表一個反斜杠,所以就能和一個反斜杠進行匹配了,那么匹配連續的兩個反斜杠,寫正則表達式時就要寫8次””了,相當壯觀,要匹配/d+(這個在正則表達式里面表示連續1一個以上的數字字符)這個字符串怎么寫呢?

        復制代碼 代碼如下:
        import re
        re_str_patt = “\\d\+”
        print re_str_patt
        reObj = re.compile(re_str_patt)
        print reObj.findall(“\d+”)

        寫成re_str_patt = “\\d+”也行,因為+對于字符串來說,沒有轉義意義,所以就當成一個反斜杠了。

        在python中寫正則表達式時用得最多的是raw字符串,原生字符串,什么意思?就是只有一重轉換了,沒有字符串轉換了,只在正則表達式內部進行轉換了,這樣匹配一個反斜杠的正則表達式可以這樣寫,re_str_patt = r”\”,有人會想,以后寫windows的文件路徑什么的方便了,呵呵直接 path = r”c:myforderxx” 搞定,是的,這句沒有問題,但是如果你寫成 path = r”c:myforderxx”,直接報錯了,為什么?因為反斜杠雖然不作為轉義字符了,但是還是對它后面的引號(包括單引號)有影響,使這個引號不被視為字符串的終止,以為它后面還有字符,但是實際沒有,因此會報錯。其實可以反過來想raw字符串里面要表示引號怎么辦呢?,可以發現 path = r”\123″xxx” 是可以的,那用raw字符串豈不是有局限性?不過raw在設計之初就是用來支持正則表達式的,而在正則里面反斜杠是轉義字符,所以不可能出現在字符串的末尾的,所以建議不要圖方便在其他的地方使用raw。

        贊(0)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 国产精品区AV一区二区| 国内精品久久久久久久亚洲| 亚洲国产精品久久久久网站| 亚洲一日韩欧美中文字幕欧美日韩在线精品一区二 | 亚洲精品国产精品乱码不卞 | 亚洲精品国产美女久久久| 国产精品亚洲综合一区| 精品国产欧美另类一区| 国产精品午睡沙发系列| 少妇精品久久久一区二区三区| 日韩精品一区二区三区影院| 精品国产污污免费网站入口| 国产成人精品无人区一区| 精品午夜久久福利大片| 99re久久精品国产首页2020| 国产综合精品一区二区三区| 无码国产精品一区二区免费模式 | AAA级久久久精品无码区| 久久99精品国产一区二区三区| 99精品视频免费| 国内精品久久久久伊人av| 欧洲精品色在线观看| 亚洲精品无码Av人在线观看国产| 四虎国产精品永久地址入口| 久久久久成人精品无码| 久久国产综合精品五月天| 精品乱码久久久久久夜夜嗨| 国产在线精品一区二区夜色| 国产精品H片在线播放| 国产A√精品区二区三区四区| 99久久www免费人成精品| 91精品国产综合久久香蕉| 97国产视频精品| 国产精品hd免费观看| 国内精品伊人久久久久影院对白| 国内精品伊人久久久久网站| 人妻无码久久精品| 亚洲无码精品浪潮| 无码国内精品久久人妻| 精品无码AV无码免费专区| 国产精品香港三级国产AV |