Dataset之WebVision：WebVision数据集简介、下载、使用方法之详细攻略

2024-04-22 04:03:49

Dataset之WebVision：WebVision数据集简介、下载、使用方法之详细攻略

WebVision数据集简介

WebVision数据集主要有Google和Flickr两个数据源。主要是利用ImageNet1000个类的文本信息从网站上爬数据，所以它的数据类别与｝mageNet完全一样，为1000类别，由240万幅图片构成训练数据。比｝mageNet的两倍还多，分别由5万张图片构成验证集和测试集（均带有人工标注）。

1、WebVision数据集挑战

(1)、数据分布不平衡

WebVision数据集主要有两个挑战。第一个挑战，数据分布非常不平衡。如图横坐标代表1000个类别，纵坐标代表每个类别的图片数量。如图浅蓝色的平稳曲线是ImageNet的数据分布，每一个类别大概有1200张图片。而深蓝色曲线为Web Vision数据分布，可以看出有的类别高达11000张，而最少的小于400张图片，这种极度不平衡的分布对训练模型影响非常大。

(2)、数据集含有大量错误或歧义的标签

第二个挑战，数据集含有大量错误或歧义的标签。数据集中含有大量与类别标签不相关或歧义的图片，也就是所谓的噪声，这也是最主要的一个难点。比如Willet可以是一种鸟，但也可以是人名，也可以是建筑物的名字。

WebVision数据集下载

后期更新……

WebVision数据集使用方法

后期更新……

赞 (0)

Python语言学习：Python常用自带库(imageio、pickle)简介、使用方法之详细攻略

Python语言学习:Python常用自带库(imageio.pickle)简介.使用方法之详细攻略 imageio简介及其常见使用方法 IMAIO是一个Python库,它提供了一个简单的接口来读取和 ...
MLDL之API：关于各国内外大平台API简介、使用方法之详细攻略

MLDL之API:关于各国内外大平台API简介.使用方法之详细攻略一.百度api 1.api之CV 更新-- 二.face++旷视api 1.api之CV:Detect API 文档中心/De ...
CV之FRec之LF：人脸识别中常用的几种损失函数(Triplet Loss、Center Loss)简介、使用方法之详细攻略

CV之FRec之LF:人脸识别中常用的几种损失函数(Triplet Loss.Center Loss)简介.使用方法之详细攻略 T1.Triplet Loss <FaceNet: A Unifi ...
CV之NS之LF：图像风格迁移中常用的几种损失函数(内容损失、风格损失)简介、使用方法之详细攻略

CV之NS之LF:图像风格迁移中常用的几种损失函数(内容损失.风格损失)简介.使用方法之详细攻略图像风格迁移中常用的几种损失函数 1.内容损失 # endpoints_dict是上一节提到的损失网络 ...
sklearn之XGBModel：XGBModel之feature_importances_、plot_importance的简介、使用方法之详细攻略

sklearn之XGBModel:XGBModel之feature_importances_.plot_importance的简介.使用方法之详细攻略相关文章 ML之xgboost:解读用法之xgb ...
sklearn：sklearn.feature_selection的SelectFromModel函数的简介、使用方法之详细攻略

sklearn:sklearn.feature_selection的SelectFromModel函数的简介.使用方法之详细攻略SelectFromModel函数的简介SelectFromModel ...
sklearn：sklearn.GridSearchCV函数的简介、使用方法之详细攻略

sklearn:sklearn.GridSearchCVl函数的简介.使用方法之详细攻略sklearn.GridSearchCV函数的简介1.参数说明"""Exhaust ...
sklearn：sklearn.preprocessing.StandardScaler函数的fit_transform、transform、inverse_transform简介、使用方法之详细攻略

sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform.transform.inverse_transform简介.使用方法之详细攻略 ...
sklearn：sklearn.preprocessing的MinMaxScaler简介、使用方法之详细攻略

sklearn:sklearn.preprocessing的MinMaxScaler简介.使用方法之详细攻略MinMaxScaler简介MinMaxScaler函数解释""&quo ...
sklearn：sklearn.preprocessing中的Standardization、Scaling、 Normalization简介、使用方法之详细攻略

sklearn:sklearn.preprocessing中的Standardization.Scaling. Normalization简介.使用方法之详细攻略Standardization& ...