python中urllib3庫和requests庫的使用

Python3 默認提供了urllib庫，可以爬取網頁信息，但其中確實有不方便的地方，如：處理網頁驗證和Cookies，以及Hander頭信息處理。

為了更加方便處理，有了更為強大的庫 urllib3 和 requests, 本節(jié)會分別介紹一下，以后我們著重使用requests。

1. urllib3庫的使用：

安裝：通過使用pip命令來安裝urllib3

    pip install urllib3

簡單使用：

import urllib3
import re

# 實例化產生請求對象
http = urllib3.PoolManager()

# get請求指定網址
url = "http://www.baidu.com"
res = http.request("GET",url)

# 獲取HTTP狀態(tài)碼
print("status:%d" % res.status)

# 獲取響應內容
data = res.data.decode("utf-8")

# 正則解析并輸出
print(re.findall("

",data))

其他設置: 增加了超時時間，請求參數等設置

import urllib3
import re

url = "http://www.baidu.com"
http = urllib3.PoolManager(timeout = 4.0) #設置超時時間

res = http.request(
       "GET",
        url,
        #headers={
        #    'User-Agent':'Mozilla/5.0(WindowsNT6.1;rv:2.0.1)Gecko/20100101Firefox/4.0.1',
        #},
        fields={'id':100,'name':'lisi'}, #請求參數信息
    )

print("status:%d" % res.status)

data = res.data.decode("utf-8")

print(re.findall("

",data))

2. requests庫的使用：

安裝：通過使用pip命令來安裝requests

    pip install requests

簡單使用：

import requests
import re

url = "http://www.baidu.com"

# 抓取信息
res = requests.get(url)

#獲取HTTP狀態(tài)碼
print("status:%d" % res.status_code)

# 獲取響應內容
data = res.content.decode("utf-8")

#解析出結果
print(re.findall("

",data))


審核編輯：湯梓紅

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

信息

信息

+關注

關注
0

文章
407

瀏覽量
36285
python

python

+關注

關注
57

文章
4850

瀏覽量
89333

python爬蟲知識分享
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 詳解TDA4的行泊一體化方案
Hot python如何捕獲異常和主動拋出異常

New 3D霍爾效應傳感器在自治系統(tǒng)中實現(xiàn)精準的實時位置控制
New 詳解平衡系統(tǒng)的ADC尺寸、功耗、分辨率和帶寬

精選推薦
更多

文章

資料

帖子

TI AM62x開發(fā)板的常見接口問題及排查思路（第2期）

飛凌嵌入式
27分鐘前

72 閱讀

【EASY EAI】基于瑞芯微RV1126B 的串口調試說明

廣州靈眸科技有限公司
1小時前

109 閱讀

ElfBoard科普課堂|為什么C語言在嵌入式技術領域中的地位難以撼動？

ElfBoard
7小時前

553 閱讀

MYD-LD25X Cortex-M33實時核開發(fā)實戰(zhàn)解析

米爾電子
9小時前

648 閱讀

RT-Thread_FRDM-MCXA346上手指南

恩智浦MCU加油站
7小時前

736 閱讀

德州儀器LED照明參考設計指南

陳貝貝
11246KB

5積分

332下載

F28335 PGF控制卡的電路圖免費下載

neptune9999999
0.14 MB

1積分

16下載

基于IRU3073_Typical Application直流到直流單輸出電源的參考設計

bigbangboom
236.71KB

2積分

2下載

Jazigo系統(tǒng)配置更改監(jiān)控

笑盡往事
0.08 MB

免費

0下載

Drawing Linux圖像編輯器

麻醬
13.85 MB

2積分

2下載

【道生物聯(lián)TKB-623評估板試用】- 2. 基于 AT 指令的網絡數據傳輸自動化測試

jf_04803658
17小時前

47 閱讀

【書籍評測活動NO.66】玩轉高速電路：基于ANSYS HFSS的無源仿真實例

dianzi_0101
17小時前

285 閱讀

cs32a010定時器的問題

jf_49350425
17小時前

203 閱讀

FreeRTOS任務調度及優(yōu)先級問題

Fingalxv
17小時前

275 閱讀

新人求助：做優(yōu)先編碼器

jf_38182604
1天前

389 閱讀

推薦專欄
更多

企業(yè)產品

資料

方案
更多

亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

搜索歷史

python中urllib3庫和requests庫的使用

1. urllib3庫的使用：

2. requests庫的使用：

評論