Python爬虫抓取内容输出中文乱码怎么办？三行代码解决 _python

python爬虫抓取回来的数据一般都是html格式的，所以需要先将其输出查看一下才好进行相应的处理。但有些时候输出出来的中文内容会变成乱码，取出来的数据也是乱码的。那么下面这一篇文章就会来详细的讲解一下如何去解决爬虫抓取内容中文乱码的问题，一起看看吧。
【Python爬虫抓取内容输出中文乱码怎么办？三行代码解决】

文章插图
python爬虫会直接的将一个网站的html结构和数据全部都抓取回来，如果在爬虫请求方法的参数之中没有设置编码字符集的话就会默认的按照python的编码格式进行处理。那么对于还没有取到数据的爬虫程序来说可以在代码的顶部加上一个表示该程序为中文编码格式utf-8的注释，示例如下：
# -*- coding: UTF-8 -*-那么数据已经取到了也可以通过添加一个新的编码字符集在这个取到的数据结构之中就可以了，示例如下：
r = requests.get('http://www.xxxxxxxxxxxxxxx.html')r.encoding = r.apparent_encodingprint(r.text)上面代码示例的意思是将r这个html结构的数据使用utf-8的中文编码格式进行解码之后再输出，这样就不会出现中文乱码的问题。
这两个方法都可以去解决爬虫抓取内容中文乱码的问题，但是最好还是需要配合来使用。当编码字符集注释没有生效时就可以使用第二个解码的方法了。
以上就是关于“Python爬虫抓取内容输出中文乱码怎么办？三行代码解决”的全部内容了，想要了解更多python的实用知识和代码示例可以持续关注这个频道，每次更新都会有很多新的知识技术分享给大家。

Python爬虫抓取内容输出中文乱码怎么办？三行代码解决

推荐阅读

锦州最好玩的地方推荐

鲁滨逊漂流记读后感鲁滨逊漂流记读后感精选篇

理发真的能促进头发生长吗理发真的可以促进头发生长吗

孟买猫的形态特征

狗的爪子抓了有事吗

怎么让猫咪喜欢上自己自己怎么给母猫猫咪拆线

164米的身高正常体重是多少

夜泉古诗和意思（夜泉古诗的翻译）

啤酒可以浇绿萝吗

需求侧和供给侧有哪些

怎么查手机号绑定了哪些软件

葛优宋丹丹买房子的电影叫什么

橘子要怎么种种橘子的步骤

婴儿学饮水杯什么材质安全婴儿学饮水杯哪种好

农行信用卡积分累计技巧是什么

超级虐心催泪文案扎心虐心的心情句子

有小孩的屋里空调开多少度合适

大樱桃对身体有好处吗食用大樱桃要注意什么

单套和四方联有什么区别

怎么快速将照片处理成小于50k