九游会,九游会官网,九游会登录,九游会注册,九游会app下载,在线体育投注,电竞投注平台,真人游戏平台,九游体育,九游娱乐
由于数据集的性质,我们无法从一些数据集的网站(如Kaggle等)获得所有图像。
但是我们找到了一个专门抓取这种类型图片的github库,所以我们可以直接使用。clone项目后可以运行下面的代码来创建文件夹,并将每个图像下载到其特定的文件夹中。
这里的folder变量表示类的名称,urls变量用于获取URL文本文件(可以根据文本文件名更改它),name变量用于为每个图像创建唯一的名称。
上面代码将为每个类下载2000张图像,可以编辑最后一个“if”条件来更改下载图像的个数。
我们下载的文件夹可能包含其他类型的文件,所以首先必须删除不需要的类型的文件。
另外图像可能包含许多重复的图像,所以我们必须从每个文件夹中删除重复的图像。
Md5为每个图像创建一个唯一的哈希值,如果哈希值重复(重复图像),那么我们将重复图片添加到一个列表中,稍后进行删除。
因为使用TensorFlow框架所以需要判断是否被TensorFlow支持,所以我们这里加一个判断:
以上就是数据准备的所有工作,在清理完数据后,我们可以拆分数据。比如分割创建一个训练、验证和测试文件夹,并手动添加文件夹中的图像,我们将80%用于训练,10%用于验证,10%用于测试。
可以使用ImageDataGenerator库,进行数据增强。数据增强也叫数据扩充,是为了增加数据集的大小。ImageDataGenerator根据给定的参数创建新图像,并将其用于训练(注意:当使用ImageDataGenerator时,原始数据将不用于训练)。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
日本人看到超市卖中国大米破防:饿死也不吃中国米!中国网友回怼:吃你们的古古古米去吧
销售利润暴跌99%!中国市场销量一降再降,德国汽车巨头宣布:将在美国涨价
针对“App出现不良广告”,宝宝巴士回应:第一时间下线相关平台广告,并开展自查
领跑珠城20万+成交!凯旋新世界,凭何成为全球资本青睐的“恒稳资产”?