之前想从图虫社区下载图片,觉得一张张下载效率太低了,于是写了一个简单的爬虫程序来帮助我爬取图片下来。

图虫社区的网址:http://tuchong.com/community

鉴于本人的python水平还不高,我便从csdn学习了一些代码下来,并且自己加以改进。具体的链接地址我忘记了,就没打上来。

图虫是中国一个比较大的摄影师社区了,里面有很丰富的图片资源,下载下来的目的主要是想retrain一下Tensorflow的Inception V3 图像分类模型。毕竟人家图虫社区已经给我分好类了,那么我就可以直接用来retrain这个模型了嘛

首先要在电脑上安装好python(Version>=3.7)以及相关的包,比如json、urllib、requests等。报错缺少哪个包就直接pip安装就好了。

然后常规操作运行起我写的这个小工具。代码已经放在gitee里了,会在文末给链接

要下载最热门的图片就运行downhot.py,下载最新图片则运行downnew.py

运行起来就显示这样:

对啊,我们要下载啥?赶紧去tuchong.com/explore去看看有什么标签

我们可以看到,有根据题材、风格、地区、器材来分类的,每个类下面都有很多标签。找到自己想要的标签,在程序里面输入即可下载了!

这速度还是很快的

那就把这个项目的地址放出来吧

https://gitee.com/fslongjin/get-tuchong-pics

有啥问题欢迎大家发邮件到longjin@RinGoTek.cn反馈哦

你也可能喜欢

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注