在python更新到30版本之后推出了一个叫做requests的第三方库取代了原本用来向服务器发送请求的模块,而它也是现在开发爬虫程序和脚本所必须使用的库 。下面这篇文章会详细介绍怎么在python中使用requests写爬虫程序抓取网页数据,感兴趣的话就往下看看吧 。
文章插图
1.因为它是一个第三方库HTTP请求库,所以需要先将其下载安装好才可以使用 。win+r快捷键打开运行窗口后输出cmd并回车就能以管理员身份进入命令行窗口,在命令行中执行如下命令即可:
pip install requests2.安装完成之后就可以新建python脚本然后将其导入使用了,而requests库内已经封装好了两个方法能够用来向服务器发送请求抓取数据返回,分别是get()方法以及post()方法 。它们二者之间的主要区别在于,请求时携带的数据是否会直接显示在url链接之中 。
而post()方法请求时所携带的数据就是会隐藏在表单之中不显示出来,所以一般要带参数发送HTTP请求都是用该方法,代码示例如下所示:
import requestsr = requests.post(url, data = (‘key’:‘value’))3.上一步中变量r就是保存了爬虫程序抓取指定网页后返回的数据,而这些数据使用之前还需要判断一下状态码是否正常,只有为200时才表示数据正常取到并且返回 。然后还需要将其转为python3默认的utf-8编码才可以识别解析出数据,最后通过该对象的text属性即可将数据获取到,详细代码示例如下所示:
if r. status_code == 200: r.encoding='utf-8' info = r.text【Python怎么用requests库写爬虫程序?如何使用requests抓取网页数据】以上就是关于“Python怎么用requests库写爬虫程序?如何使用requests抓取网页数据”的全部内容了,希望对你有所帮助 。
文章插图
文章插图
文章插图
微信扫码,学习更方便
文章插图
现在报名赠100例知识点合集
文章插图
推荐阅读
- 扁桃体化脓怎么治最快
- 中国移动包流量怎么包?
- 寒包火体质怎么调理 日常养生不可缺少
- 平时怎么做可以减肥 要怎么做才能减肥
- 猴头菇粉能长期服用吗 猴头菇粉能不能长期服用
- 母乳宝宝一直不吃奶瓶怎么办 大家可以了解一下
- 夏天化妆品使用的先后顺序是什么 夏天化妆品的顺序是怎样的
- 乌拉草的用途 它有什么功效
- 兰花叶尖发黄怎么办
- 想知道:张家口市 从张北县到滦河神韵风景区自驾怎么走?