之前想从图虫社区下载图片,觉得一张张下载效率太低了,于是写了一个简单的爬虫程序来帮助我爬取图片下来。
图虫社区的网址:http://tuchong.com/community
鉴于本人的python水平还不高,我便从csdn学习了一些代码下来,并且自己加以改进。具体的链接地址我忘记了,就没打上来。
![](https://longjin666.top/wp-content/uploads/2020/07/image-1024x517.png)
图虫是中国一个比较大的摄影师社区了,里面有很丰富的图片资源,下载下来的目的主要是想retrain一下Tensorflow的Inception V3 图像分类模型。毕竟人家图虫社区已经给我分好类了,那么我就可以直接用来retrain这个模型了嘛
首先要在电脑上安装好python(Version>=3.7)以及相关的包,比如json、urllib、requests等。报错缺少哪个包就直接pip安装就好了。
然后常规操作运行起我写的这个小工具。代码已经放在gitee里了,会在文末给链接
要下载最热门的图片就运行downhot.py,下载最新图片则运行downnew.py
运行起来就显示这样:
![](https://longjin666.top/wp-content/uploads/2020/07/image-1.png)
对啊,我们要下载啥?赶紧去tuchong.com/explore去看看有什么标签
![](https://longjin666.top/wp-content/uploads/2020/07/image-2-1024x573.png)
![](https://longjin666.top/wp-content/uploads/2020/07/image-3-1024x414.png)
![](https://longjin666.top/wp-content/uploads/2020/07/image-4-1024x616.png)
我们可以看到,有根据题材、风格、地区、器材来分类的,每个类下面都有很多标签。找到自己想要的标签,在程序里面输入即可下载了!
![](https://longjin666.top/wp-content/uploads/2020/07/image-5.png)
![](https://longjin666.top/wp-content/uploads/2020/07/image-6.png)
这速度还是很快的
那就把这个项目的地址放出来吧
![](https://longjin666.top/wp-content/uploads/2020/07/image-7-1024x527.png)
有啥问题欢迎大家发邮件到longjin@RinGoTek.cn反馈哦