分享
  • 收藏
  • 举报
    X
    关于下载网站书籍图片的教程之一:工具篇
    83403
    3

    1前言

    上一篇主要阐述了关于下载图片的原理,在这一篇主要讲解一些工具的用法,当然这部分工具没有任何涉及编成的内容,因为这两篇教程是按照刚刚接触互联网用户的水平来叙述,尽可能的把复杂问题拆解,用简单的语言描述出来。

    这部分所有的基础是上一篇所说的图片下载原理,不论网站如何改变,工具如何更新,原理是不会变化的。

    我将在以下说明的工具不需要任何编程基础,但仍需要有一定的计算机基础,层次大约会下载软件,使用office

    强调

    这个办法固定不变的,获取链接的办法千千万,我只是选择了它作为获取的途径,如果想要更深入的了解,必然不能墨守成规。

    2寻找网页代码

       当我们发现网站的图片没有任何规律可循(根据群友芥诚的提示,存在按顺序的书籍,不过我接触甚少,便以图片地址乱序的情况下来展开),便要想办法获得这些乱序的图片地址,将他们按照书页顺序排列。

     我的方法(还是要提醒大家,方法很多,我使用的方法可能有些网站不行,需要自己去琢磨)如下:

     2.1 思路:我发现网页加载后,缩略图会全部加载,并且它的顺序是完全按照书本顺序排列的,只要确定缩略图的地址数字与实际需要的图片地址相符,那么替换进下载地址便可以简单解决。

     2.1 验证


    检查缩略图代码,发现一连串li”标签,这说明每个标签下面都包含一张缩略图。

       2.1.3编辑该段落的代码

         将li标签上一层的代码全部copyword,细细检查。

    2.1.4检查规律是否存在

    随机下载两张相邻的图片,发现他们的地址是完全符合预期的。5378125353781478这两张图片在word文档中也是先后关系

    2.1.5验证结论

    通过验证确实发现li标签可以为我们所用来获取地址。当然如果它不能使用还得想其他办法,需要从新开始验证。

    3代码处理

       3.1 进行预处理

       将所有代码中的标签和重复字符全部替换为空格。每次都替换3000多个部位,说明有3000多个地址,对应有三千多图片。

       具体替换需要根据你获取的代码进行,也就是说在这一步你需要找到重复元素,将他们剔除,一直变化的数据才是你需要的,如果没有office基础那我也没有任何办法了。

     重复的部分减除之后,这个就是剩下的精华,也是下载地址中变化的部分,顺序完全正确,当然你还要继续减除,时间关系我就不再继续了。

      3.2 进行代码填充

        将变化的部分填充进入excel表格,这样你的地址就出来了。

    4下载图片

    基本上当地址出来后,所以的工作已经完成90%了。后面只要使用下载器下载就可以了,不过教程面向大众,水平层次不同,所以我还是要详细介绍后面10%的工作,善始善终。

    我是用的是chrome+图片助手

        4.1 打开图片助手

    选择多地址提取,这也是这个插件的好处之一,可以批量来处理链接可以设置一次性处理图片的数量。默认1024张。

       4.2插入地址

      直接复制,空格什么的不用理会。

      4.3开始处理

       4.4直接下载


    5结语

      终于写完了,不知不觉又是一个下午。虽然真正操作起来十来分钟左右,但是写字加上截图反而时间花的多得多。

      还是那就句老话,方法很多,如果想要进步还是要自己钻研。

     另外,昨晚有***的站长的工具,大家也可以试一试,时间关系我就没有多操作了,原理大同小异。

    望进步!

    2020.03.26楚杰


    版权信息

    未经本人授权,一律不得转载,仅供该网站学习使用。


    8
    赏礼
    赏钱
    收藏
    点击回复
    • wenjf89 普通書友 2023-01-11 16:55 16:551楼
    0 赏钱 赏礼回复
    • 火铃羽客 普通書友 2021-08-08 05:09 05:09
      其他手机
      1楼
      谢谢
    0 赏钱 赏礼回复
    • 楚杰 網站合作 2020-03-28 18:43 18:431楼
      这一篇是完结篇。虽然各个网站的图片下载大同小异,但是原理基本相同,在有些网站,页面不提供缩略图的时候,可以通过判断图书的加载方式来选择其他方式获得批量图片地址,这些地址在源代码中一般是以“li”标签存在。
      另外此系列授权站长发布在公众号中大家可以多多关注。
    2 赏钱 赏礼回复
    更多回复
    恢复多功能编辑器
  • 3 1
  • 推荐内容
    扫码访问

    客服

    请选择要切换的马甲: