Python 爬虫
--安装爬虫需要的爬虫库
C:\python37>pip install requests

Collecting requests
Downloading https://files.pythonhosted.org/packages/7d/e3/20f...84b/requests-2.21.0-py2.py3-none-any.whl (57kB)
100% |████████████████████████████████| 61kB 225kB/s
Collecting urllib3<1.25,>=1.21.1 (from requests)
Downloading https://files.pythonhosted.org/packages/62/00/ee1...79e/urllib3-1.24.1-py2.py3-none-any.whl (118kB)
100% |████████████████████████████████| 122kB 585kB/s
Collecting idna<2.9,>=2.5 (from requests)
Downloading https://files.pythonhosted.org/packages/14/2c/cd55...4c9/idna-2.8-py2.py3-none-any.whl (58kB)
100% |████████████████████████████████| 61kB 1.3MB/s
Collecting chardet<3.1.0,>=3.0.2 (from requests)
Downloading https://files.pythonhosted.org/packages/bc/a9/01ffe...b8/chardet-3.0.4-py2.py3-none-any.whl (133kB)
100% |████████████████████████████████| 143kB 267kB/s
Collecting certifi>=2017.4.17 (from requests)
Downloading https://files.pythonhosted.org/packages/9f/e0/ac...e8a/certifi-2018.11.29-py2.py3-none-any.whl (154kB)
100% |████████████████████████████████| 163kB 273kB/s
Installing collected packages: urllib3, idna, chardet, certifi, requests
Successfully installed certifi-2018.11.29 chardet-3.0.4 idna-2.8 requests-2.21.0 urllib3-1.24.1
什么是Urllib
Python内置的Http请求库
urllib.request 请求模块 模拟浏览器
urllib.error 异常处理模块
urllib.parse url解析模块 工具模块,如:拆分、爬虫合并
urllib.robotparser robots.txt 解析模块
urllib是爬虫Python自带的企商汇标准库,无需安装,爬虫直接可以用。爬虫
提供了如下功能:
网页请求
响应获取
代理和cookie设置
异常处理
URL解析
爬虫所需要的爬虫功能,基本上在urllib中都能找到,亿华云爬虫学习这个标准库,爬虫可以更加深入的爬虫理解后面更加便利的requests库。
2和3的爬虫区别
Python2
import urllib2
response = urllib2.urlopen(http://www.baidu.com);
Python3
import urllib.request
response =urllib.request.urlopen(http://www.baidu.com);
用法:
urlOpen 发送请求给服务器。服务器租用
urllib.request.urlopen(url,爬虫data=None[参数],[timeout,]*,cafile=None,capath=None,cadefault=false,context=None)
例子:
import urllib.requests
response=urllib.reqeust.urlopen(http://www.baidu.com)
print(response.read().decode(utf-8))
相关文章
- 摘要:在当今高科技时代,液晶显示技术已经成为人们日常生活中不可或缺的一部分。其中,LCD70TX85A作为最新一代的顶级液晶显示器,以其卓越的技术和令人叹为观止的视觉效果,引领了液晶显示...2025-11-04
 
英特尔凌动® x7000系列处理器:重构边缘计算的算力基石技术架构:边缘场景的深度适配英特尔凌动® x7000系列代号Amston Lake)作为 2024 年推出的边缘计算专用处理器,其架构设计围绕2025-11-04
中文域名有什么好?如何注册中文域名?中文域名是包含中文的新一代域名。和英文域名一样,它是互联网上的门牌号。然而,仍然有很多站长对“中文域名的用途是什么”和“为什么注册中文域名”有疑问。编辑觉得中文域名2025-11-04
购买好域名有哪些因素?新手可以怎么进行注册?很多人一直向往着好域名,但是就是不好购买好域名,其实好域名是有技巧的;下面益华网络就带大家看看购买好域名有哪些因素和新手可以怎么进行注册。购买好域名有哪些因2025-11-04如何从iCloud恢复出厂设置(一步步教你恢复设备到出厂设置)
摘要:在日常使用中,我们的设备可能会出现各种问题,例如系统崩溃、数据丢失等。为了解决这些问题,恢复设备到出厂设置是一个常见的方法。本文将详细介绍如何通过iCloud来恢复设备到出厂设置。...2025-11-04
vip域名属于哪个国家?vip域名如何?vip域名的注册将很快开放。VIP域名引起了广泛关注。目前,计划的域名数量已经超过15000个。那么,这个.vip域名属于哪个国家?下面聚名网就带大家看看vip2025-11-04

最新评论