Pycharm运行Scrapy项目怎么做?Pycharm编辑器如何运行Scrapy框架项目

Scrapy是现在非常流行的一个python爬虫框架 , 而使用和运行这个框架就是要用它来创建项目才可以 。所以这一篇文章会同时介绍pycharm集成开发工具使用Scrapy爬虫框架创建项目的方法、以及项目结构的含义和运行项目的方式 , 想要使用它的小伙伴就继续往下阅读吧 。

Pycharm运行Scrapy项目怎么做?Pycharm编辑器如何运行Scrapy框架项目

文章插图
一、创建Scrapy项目
1.运行Scrapy项目的前提就是将这个第三方框架给下载按照好 , 使用系统自带的命令行窗口或者是pycharm内的终端都可以执行pip命令 。下载安装完成之后就是要打开终端来执行命令创建Scrapy项目了 , 示例如下所示:
【Pycharm运行Scrapy项目怎么做?Pycharm编辑器如何运行Scrapy框架项目】scrapy startproject ScrapyTmp这个命令执行完毕之后会在当前打开文件的根目录下生成对应的文件结构 , 所以需要尽量保持文件目录内没有其他文件比较好 。
Pycharm运行Scrapy项目怎么做?Pycharm编辑器如何运行Scrapy框架项目

文章插图
二、项目结构
这个命令执行完成之后生成项目结构很简单 , 其中spiders文件夹内放的就是Scrapy框架各个组件的文件 , 而cfg文件是用来配置该框架项目的 。而其余的几个文件按照顺序分别为爬虫程序数据模型、数据模型的中间件、爬虫程序设置文件 , 则具体实现python爬虫操作的脚本就要另外去创建了 。
Pycharm运行Scrapy项目怎么做?Pycharm编辑器如何运行Scrapy框架项目

文章插图
三、运行Scrapy项目
还是一样需要打开pycharm编辑器终端 , 这次执行的命令是在spiders文件夹下创建出来一个能够执行python爬虫操作的py文件 。之后也是通过这个文件来完成数据的抓取和处理操作 , 两个命令如下所示:
scrapy genspider baidu_spider baidu.comscrapy crawl baidu_spider以上就是关于“Pycharm运行Scrapy项目怎么做?Pycharm编辑器如何运行Scrapy框架项目”的全部内容了 , 希望对你有所帮助 。

    推荐阅读