今天来跟大家分享用 BeautifulSoup 获取信息的一些知识点 , 文章内容由公众号读者 Peter 创作 。
欢迎各位童鞋向公众号投稿 , 点击下面图片了解详情!
爬虫 , 是学习Python的一个有用的分支 , 互联网时代 , 信息浩瀚如海 , 如果能够便捷的获取有用的信息 , 我们便有可能领先一步 , 而爬虫正是这样的一个工具 。
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库 。由于 BeautifulSoup 是基于 Python , 所以相对来说速度会比另一个 Xpath 会慢点 , 但是其功能也是非常的强大 , 本文会介绍该库的基本使用方法 , 帮助读者快速入门 。
网上有很多的学习资料 , 但是超详细学习内容还是非官网莫属 , 资料传送门:
英文官网:
https://www.crummy.com/software/BeautifulSoup/bs4/doc/
中文官网:
https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
本文的主要内容如下:
安装和使用 安装
安装过程非常简单 , 直接使用pip即可:
pip install beautifulsoup4
上面安装库最后的4是不能省略的 , 因为还有另一个库叫作 beautifulsoup , 但是这个库已经停止开发了 。
因为BS4在解析数据的时候是需要依赖一定的解析器 , 所以还需要安装解析器 , 我们安装强大的lxml:
pip install lxml
在python交互式环境中导入库 , 没有报错的话 , 表示安装成功 。
使用
使用过程直接导入库:
from bs4 im
推荐阅读
- 首选这8款电视软件 网络电视软件哪个好用
- 二次元中中二病又称初二症 网络用语中二病是啥意思
- 如何通过网络赚钱,利用网络挣钱的几种方法
- 网站推广软文是什么,网络软文推广案例
- 计算机网络应用专业一体化课程方案! 计算机应用学习
- 网络言论最多的8封辞职信 辞职信30字最简单的个人辞职原因
- 网络营销方法有哪些,10常用的网络营销方法推荐
- 开机网速慢原因和解决措施 电脑开机网络连接慢怎么解决
- 什么减肥产品比较靠谱,10款网络爆红的产品推荐
- 新手如何通过网络挣钱 上网赚钱的方法