关于在eclipse中运行爬虫scrapy框架的项目介绍如下。
scrapy官方文档:http://scrapy-chs.readthedocs.io/zh_CN/0.24/topics/shell.html
首先打开终端将cd
至eclipse目录下的(即eclipse-workspace),使用命令行scrapy startproject tutorial
(其中的tutorial是自由选择的),之后会生成一个目录,将其目录移至一个python工程下。
如上图。
在spider包下建立一个脚本文件(如上图我的那个first文件,名字随意),是用来写爬虫程序用的。之后在tutorial包下建立一个名为cmdline的脚本文件(名字随意)。
下面为了直接达到运行成功的目的,贴上测试用的代码。
first.py中的代码:
|
|
cmdline.py中的代码:
|
|
items.py中的代码:
import scrapy
class TutorialItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
title = scrapy.Field()
link = scrapy.Field()
desc = scrapy.Field()
这个文件是与first文件有直接联系的。可参考官方文档介绍。
运行
接下来直接运行cmdline.py可得出结果:
配置调试
直接看下面的图上解说吧。
接下来点击debug。
最终两者均可达到输出的效果!
参考: