1. requests 基本使用
1.1. requests 介绍
requests 是 Python 中一个常用于发送 HTTP 请求的第三方库,它极大地简化了 Web 服务交互的过程。它是唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。
1.2. requests 库的安装
pip install requests
1.3. requests 基础语法
import requests
url = 'http://www.baidu.com'
response = requests.get(url)
1.4. response 的属性以及类型
(1)一个类型:
print(type(response)) # <class 'requests.models.Response'>
(2)六个属性:
# 是指相应的编码格式
response.encoding = 'utf-8'
# 以字符串形式返回网页源码
print(response.text)
# 获取请求头
print(response.url)
# 返回二进制数据
print(response.content)
# 返回状态码信息
print(response.status_code)
# 获取响应头信息
print(response.headers)
2. requests 的 get 请求
爬取郑州页面信息,和 urllib 基本差不多,只要明白 urllib,相信 requests 的 get 请求也不会有什么难度。
import requests
url = 'https://www.baidu.com/s?'
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36"
}
data = { "wd":"郑州" }
# url 请求资源路径 params 参数 kwargs 字典
response = requests.get(url=url, params=data, headers=headers)
content = response.text
print(content)
与 urllib 的 get 请求区别:
1、参数需要使用 params 传递 2、参数无需 urlencode 3、不需要请求对象的定制 4、请求资源路径中的?可以省略


