爬取的URL地址:https://unsplash.com/
这是一个优美图片地址,往下拉就可以出来更多的图片,这显然是一个动态网页呀…
分析
关于详细分析以及我的参考可见:http://blog.csdn.net/c406495762/article/details/78123502
因为分析方向一致,我就不在此说了,我跟这位博主的工具有一些出入,实际上用Chrome分析已经足够了。
##代码
这是我后来自己写的代码,比上面博主的简短一些,亦可参考参考。
|
|
虽然说我的代码简短一点,不过我还是支持面对对象模式编程的,方便以后的学习,也是对自己的一种考验。
运行之后在本工程目录可见:
最后再补充说明一下:
每一次的拉取新的图片时,进行抓包,得知新的图片ID以及一个页面,通过分析此页面便可得到图片相关的信息,进而进行下载保存了(如下图)。
简单说说当时的情况,在参考了上面博主的分析过程后,利用了Chrome下载器的下载发现了图片的信息,然后我用urlretrieve函数单张下载的测试,发现成功了…附上代码。
|
|
不过从来都没有见过这种src信息…算是开了眼界,长了知识啦。