站長資訊網
        最全最豐富的資訊網站

        詳解Python之urllib爬蟲、request模塊和parse模塊

        詳解Python之urllib爬蟲、request模塊和parse模塊

        文章目錄

        • urllib
        • request模塊
          • 訪問URL
          • Request類
          • 其他類
        • parse模塊
          • 解析URL
          • 轉義URL
        • robots.txt文件

        (免費學習推薦:python視頻教程

        urllib


        urllib是Python中用來處理URL的工具包,源碼位于/Lib/下。它包含了幾個模塊:用于打開及讀寫的urls的request模塊、由request模塊引起異常的error模塊、用于解析urls的parse模塊、用于響應處理的response模塊、分析robots.txt文件的robotparser模塊。

        注意版本差異。urllib有3個版本:Python2.X包含urlliburllib2模塊,Python3.X把urlliburllib2以及urlparse合成到urllib包中,而urllib3是新增的第三方工具包。若遇到"No module named urllib2"等問題幾乎都是Python版本不同導致的。

        urllib3是一個功能強大、條例清晰、用于HTTP客戶端的Python庫。它提供了許多Python標準庫里所沒有的特性:壓縮編碼、連接池、線程安全、SSL/TLS驗證、HTTP和SCOCKS代理等。可以通過pip進行安裝:pip install urllib3
        詳解Python之urllib爬蟲、request模塊和parse模塊
        也可以通過GitHub下載最新代碼:

        git clone git://github.com/shazow/urllib3.git python setup.py install

        urllib3參考文檔:https://urllib3.readthedocs.io/en/latest/

        request模塊


        urllib.request模塊定義了身份認證、重定向、cookies等應用中打開url的函數和類。

        再簡單介紹下request包,該包用于高級的非底層的HTTP客戶端接口,容錯能力比request模塊強大。request使用的是urllib3,它繼承了urllib2的特性,支持HTTP連接保持和連接池,支持使用cookie保持會話、文件上傳、自動解壓縮、Unicode響應、HTTP(S)代理等。

        贊(0)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 人妻少妇精品无码专区二区| 国产一成人精品福利网站| 亚洲精品色午夜无码专区日韩| 99re8这里有精品热视频免费| 久久久久久无码国产精品中文字幕| 99热门精品一区二区三区无码| 久久久久人妻一区精品| 99re66在线观看精品免费| 国产成人亚洲精品| 久热这里只有精品12| 欧美精品黑人粗大视频| 国产精品亚洲综合专区片高清久久久 | 精品国产一区AV天美传媒| 日本国产精品久久| 国产精品综合专区中文字幕免费播放| 精品国产一区二区三区久久| 久久久精品人妻一区二区三区蜜桃| 精品人妻伦一二三区久久| 国产精品hd免费观看| 欧美成人精品一级高清片| 91麻豆精品国产自产在线观看一区 | 久久久久久夜精品精品免费啦| 午夜精品一区二区三区在线视| 久久久久九国产精品| 久久精品视频91| 国产亚洲精品激情都市| AAA级久久久精品无码区| 久久精品9988| 亚洲国产精品一区二区久久| 国产精品高清一区二区三区不卡| 国产精品无码无在线观看| 一级A毛片免费观看久久精品| 日韩精品一区二区三区不卡| 欧美日韩精品一区二区视频| 久久精品亚洲欧美日韩久久| 久久久久国产精品麻豆AR影院| 国产亚洲精品线观看动态图| 国产欧美在线观看精品一区二区| 国产精品免费大片一区二区| 国产精品自在线拍国产手机版| 久久精品国产精品亚洲人人|