应群内朋友“道行天下”之约,我整理下载网站书籍图片的教程,免费分享之际,希望与大家交流学习,如有指点,望不吝补充。
首先,我将阐述该教程的主要脉络,也就是核心。本教程以下载网站高清大图为最终目标,以网站图片真实链接为切入点,批量下载为手段,完成书籍转存本地的过程。
示意图如下:
以下内容皆是围绕这三点来展开,这也是所有下载图片方法的核心,因为无论你在网络的那个角落下载图片,都绕不开这三点。
想要下载网路图片,首先得知道网站的图片从何而来?或者你要思考,为什么网站上会有图片让你下载?
其实,这个问题看似没头没脑,水平不高,但是却是你所有下载行为的根基,不论网络变的多快,这些东西是不会改变的。
问题很简单,这些网路的图片都是“人”上传到服务器,通过图片地址插入到网页代码中,最后在你的显示屏上显示出来的。所以你想要下载图片的前提是必须有人在你能访问的服务器中上传图片,而你看见图片只是通过服务器中图片地址反馈出来的。
没有什么高达上的答案,但是你已经从字里行间知道,想要下载到图片,你必须要得到那张图片在服务器中的地址,推而广之,你想下载的任何图片都有与之对应的地址。
另一个问题,如果图片地址在你不能访问的服务器中,你要怎么处理呢?嗯,这将会是一个长篇教程了,所以暂且不表。
由上述内容,可以知道图片地址对于下载图片是必不可少的,如何获取图片地址呢?
一千个人有一万办法,办法非常之多,我简述我的办法。
以该网站为例,简述查询图片地址的办法。
1)F12或者右击网页选择“检查”
2)右点击缩略图。可以清晰看见图片的地址,但是这个地址的图片的大小是82*76,所以这个是方便浏览的小图不是我们需要的高清大图。但是,它在后面会有 大用,之后再说。
3)寻找下载一张大图图片。
4)由于我网页的问题,下载按钮一直被其他网页元素遮住了,所以我直接查看源码,可以看见分辨率分为300,800,1200,2400
点击2400下的链接地址https://ids.lib.harvard.edu/ids/iiif/53780348/full/2400,/0/default.jpg?download&caption
得到以下图片。这正是我们想要的,所以地址是可以使用的。
5)连续下载多张图片,检查链接地址。
https://ids.lib.harvard.edu/ids/iiif/53780348/full/2400,/0/default.jpg?download&caption |
https://ids.lib.harvard.edu/ids/iiif/53781253/full/2400,/0/default.jpg?download&caption |
只要稍微辨别就会发现地址中有变化的地方也有不变的地方
(注意:由于这个网站的图片地址并非是连续不间断的变化,而是乱序的变化,如果一个链接一个链接的寻找比直接下载图片更费力气,这时之前的缩略图将会有大用处)
由于晚上时间原因,暂时到此,下面会写如何获取连续地址,如何使用工具下载。
未完待续。
2020.03.25楚杰
版权信息
未经本人授权,一律不得转载,仅供该网站学习使用。
客服