使用Scrapy爬取图片

最新推荐文章于 2025-09-07 12:33:56 发布

原创

最新推荐文章于 2025-09-07 12:33:56 发布 · 582 阅读

标签

#python

收录于

本文介绍了如何使用Scrapy框架爬取美食杰网站上的川菜菜谱图片。首先分析网址结构，接着配置items.py定义爬取内容，设置pipelines.py实现图片下载，再在settings.py中调整相关参数，最后运行scrapy爬虫。

使用Scrapy爬取图片

分析网址
配置Scrapy
运行scrapy

分析网址

网址地址：美食杰-川菜.
我们需要爬取网站上的菜谱图片，分析网址结构如下：

#在命令行中运行
scrapy shell "https://www.meishij.net/china-food/caixi/chuancai/"
#可以发现我们想要爬取的图片src地址位于：
picture_src = response.xpath('/html/body/div[6]/div/div[3]/div[2]/div[1]/div//@src')
#图片标题位置位于：
picture_title = response.xpath('/html/body/div[6]/div/div[3]/div[2]/div[1]/div//@title')

接下来就可以展开爬取工作了

配置Scrapy

首先要生成scrapy，在命令行中运行

scrapy startproject meishijieSpider
cd meishijieSpider
scrapy genspider meishijie

进入文件开始配置具体工作

配置items.py

我们只需要爬取图片名称和下载链接，所以：

import scrapy

class MeishijiespiderItem(scrapy.Item):
    name = scrapy.Field()
    src = scrapy.Field()

##配置meishijie.py
进入spiders文件夹，打开meishijie.py，首先导入之前定义的item，并写好初始爬取url：

import scrapy
from ..items import MeishijiespiderItem
import time

class

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_43289228

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

用scrapy爬取下载某图片网站的全部图片

08-20

用scrapy爬取下载某图片网站的全部图片。代码中已经去除了具体网站的信息，代码只供学习用。

scrapy爬取图片并保存在不同的文件夹下

折戟沉沙

11-09

3844

文章目录1、爬取的网站2、创建项目和爬虫模块3、settings.py配置爬虫的配置信息4、animal.py主要是通过xpath获取页面的信息5、items.py定义属性字段6、pipelines.py模块，处理animal.py传递过来的信息，将信息和图片保存在对应的位置7、在项目的根目录下创建批处理文件animal.bat，方便快速执行命令8、在项目的根目录中执行批处理文件 1、爬取的网站 ...

参与评论您还未登录，请先登录后发表或查看评论

爬虫之利用Scrapy进行图片的爬取

weixin_46297209的博客

12-07

2850

爬虫之利用Scrapy进行图片的爬取一：Scrapy自带管道方法爬取创建爬虫文件 scrapy genspider image360 image360.com 修改配置文件settings.py 配置文件中的图片管道类是scrapy自定义好的，不需我们编写，直接用就行了 ITEM_PIPELINES = { # 'reptile.pipelines.ReptilePipeline': 300, 'scrapy.pipelines.images.ImagesPipeline'

Python爬虫——使用Scrapy实现图片的爬取（四）

lucky_shi的博客

03-14

1288

使用scrapy实现爬虫实例——图片爬取继前三章中Spider爬取数据，Item收集数据后交给Pipeline对数据进行处理，本章在前三章的基础上继续实现对图片的爬取。一、Spider爬取数据 spider文件夹中booksSpider.py代码： from scrapy import Request from scrapy.spiders...

python使用xpath提取a标签中的img数据_使用xPath提取嵌套的“img src”

weixin_39533361的博客

12-04

3443

我对使用Scrapy或python来处理这个问题还比较陌生。我希望从几个不同的链接中提取，我在使用HTMLXPathSelector表达式(语法)时遇到问题。我查看了大量的文档以了解正确的语法，但是还没有找到解决方案。在下面是一个我试图从中提取“img src”的链接示例：from scrapy.spider import BaseSpiderfrom scrapy.selector import...

python使用scrapy爬取图片

人生苦短，还不用Python？

06-04

1657

在前面的章节中都介绍了scrapy如何爬取网页数据，今天介绍下如何爬取图片。下载图片需要用到ImagesPipeline这个类，首先介绍下工作流程： 1 首先需要在一个爬虫中，获取到图片的url并存储起来。也是就是我们项目中test_spider.py中testSpider类的功能 2 项目从爬虫返回，进入到项目通道也就是pipelines中 3 在通道中，在第一步中获取到的图片url将...

使用scrapy爬取图片

最新发布

weixin_35750953的博客

09-07

1334

Scrapy 是一个基于 Python 的高性能网络爬虫框架，专为大规模数据抓取设计。其异步处理机制与模块化架构，使其在处理图片爬取等资源密集型任务时表现出色。本章将从 Scrapy 的整体架构出发，介绍引擎（Engine）、调度器（Scheduler）、下载器（Downloader）、Spider、Item Pipeline 和 Middlewares 等核心组件的协同工作机制。在图片爬取场景中，Scrapy 可高效处理图片 URL 提取、异步下载、格式转换、存储路径配置等任务。

scrapy框架爬取网站图片

Wfarmer的博客

03-20

3131

使用scrapy 框架爬取彼岸图库前言：这两天在网上学习了一下scrapy框架，发现及其好用，把爬虫步骤分的细细的。所以写了一个简单项目回顾一下并分享给大家^ . ^ 源码我已经放到Github了 scrapy框架运行结构爬虫把要提交的 url 传给引擎经过引擎后，url 传给调度器，调度器把 url 排队处理，后把排好的 url 传给引擎引擎接到 url 后传给下载器对浏览器进...

Scrapy爬虫框架之———— 多页爬取图片的信息

magicboom的博客

04-29

2509

ok, 接下来我们要将怎样多页爬取图片的信息，以及如何下载图片。知识点涉及到：自动的翻页爬取多个parse 之间的request 传递构建图片爬取的通道さあ！始めようぜ！首先我们要爬取的网站是这个：知名的动漫壁纸网 Konachan.net 确定了目标之后，我们的第一个任务是创建一个爬虫项目以及一个爬虫 scrapy startpro...

使用Scrapy爬取豆瓣图片

濯君

05-31

896

使用Scrapy爬取豆瓣某影星的所有个人图片以莫妮卡·贝鲁奇为例一：首先我们在命令行进入到我们要创建的目录，输入 scrapy startproject banciyuan 创建scrapy项目创建的项目结构如下二：为了方便使用pycharm执行scrapy项目，新建main.py from scrapy import cmdline cmdline.execute("scrapy crawl banciyuan".split()) 再edit configuration 然后进行如下设

scrapy框架爬取图片的那些事

m0_37623374的博客

05-17

961

Scrapy爬取图片资源

G_Q_L的博客

08-07

1088

scrapy爬取图片案例练习了爬取文字信息的案例，接着练练爬取图片。scrapy的功能真心强大。目的：爬取斗鱼美女主播的图片网址：斗鱼主播信息这是网址的数据内容：可以看到是json格式的数据创建工程和spiderscrapy startproject Douyu scrapy genspider dyspider 编写itemimport scrapyclass DouyuItem

Scrapy爬取图片并重命名总结

weixin_44806438的博客

10-22

1500

文章目录Scrapy爬取图片并重命名总结项目分析：开始项目：启动项目：总结 Scrapy爬取图片并重命名总结项目分析： 1、现在很多网页都是动态加载资源，数据都不在静态html模板上，都是通过重定向从json文件中加载而来，因此只要抓取json数据包即可，这是一种捷径，比较容易，并不利于爬虫的学习，所以以后还是在数据实在不好得到的情况下使用 2、开发环境及工具介绍 python 3.6 scra...

怎么用Scrapy爬取网站图片？

cnfengzheng的博客

07-19

1256

使用Scrapy爬取网站图片并下载（使用XPATH路径来获取图片链接）。对爬取成功的图片连接入库。

scrapy爬取图片详细步骤

ding283595861的博客

09-11

4025

1.爬取https://image.so.com/z?ch=photography图片，用谷歌浏览器打开开发者工具，选中XHR选项, 由于使用了AJAX ,可以看到页面的刷新情况. 待会附上的源码就有拼接url：https://image.so.com/zj?key=value&key1=value2… 以及json字段解析 ...