数据集查找神器!1000 个机器学习常用数据集都汇总在这了

“想用算法解析世界,算法工程师却在数据里消耗”如果脑海中的共鸣可以发声,那么现在每位工程师都在咆哮

在算法工程师的工作中,数据查找处理覆盖了一大片灰色时光,占据正常工作时间80%以上

有需求就会有供给,针对该痛点,Graviti为各位算法工程师提供了一站式解决方案

Graviti OpenDatasets

海量优质公开数据集搜索,1000+优质数据集,30+应用场景,20+标注类型,10+数据格式

免费获取,快速获取与使用数据集,助力AI开发落地

便捷云端使用,通过开发者工具,无需下载即可云端读取数据

▲丰富多元的数据集

Open Datasets 01

快捷数据集查找与筛选

在Open Datasets,您可以通过数据集的名称联想检索、应用场景筛选、标注类型筛选、推荐、更新时间及热度筛选,轻松找到所需数据集

数据应用场景多元,标注类型划分规整简洁

30+种AI应用场景

2D/3D目标检测、图像分割、图像分类、目标跟踪、OCR、姿态估计、无人驾驶、智慧零售、机器人等

20+种标注类型

2D分类、2D多边形、2D矩形等

多种数据格式

点云、图像、视频序列、三维模型等

Open Datasets 02

数据的结构化描述

Open Datasets拥有明晰的信息展示方式,通过将数据的应用场景、标注类型、数据概要信息及协议信息结构化,方便您迅速定位数据关键信息,提高您的阅读体验

Open Datasets 03

标注数据在线可视化

在Open Datasets,您无需下载,即可在数据集详情页在线查看标注情况及标签分布,掌握细节,所见即所得

▷ 标注数据可视化

▷ 标签分布可视化

支持列表、柱状图、饼图(滑动查看)

Open Datasets 04

免费获取,在线使用

通过Fork数据集,您即可通过开发者工具,使用Python SDK、CLI或Open API来在线管理、读取数据,无需下载、解压、转换数据结构,即可直接对接TensorFlow和Pytorch等AI训练框架。

同时在每个数据集的详情页的代码板块,我们提供了读取数据的代码,您可直接复制使用

我们为社区用户免费提供非结构化数据云端管理SaaS

>>Fork后,您可在“我的数据集”管理您Fork的数据集

▷ 灵活发布与切换版本,清晰追踪迭代过程

▷ 支持通过标签筛选,使用数据

▷ 数据在线可视化,实时查看

▷ 基于角色的权限管理与使用分离

Open Datasets 05

畅享海外数据高速下载

如果您想下载数据集至本地,Graviti也为您提供高速稳定的下载服务。将全球资源Host至国内镜像,无需VPN访问,满带宽极速下载。与进入海外官网下载相比,Graviti至少提速100%

>>选择Open Datasets,告别繁琐的登录注册流程,告别令人抓狂的下载时长!

▲普通带宽下载海外数据,实测就有10+MB/s的速度

Open Datasets 06

完善的社区支持模块

面对更多元的个性化用户需求,Graviti为社区用户提供问题与需求的反馈渠道,一对一针对性回应、跟进、解决您的需求

官网反馈入口

我们重视每一条用户反馈

关于「格物钛」

格物钛定位为面向机器学习的数据平台,帮助AI开发者解决日益增长的非结构化数据难题。借助非结构化数据管理平台TensorBay和开源数据集社区Open Datasets,机器学习团队和个人可进行数据管理、查询、协同、可视化和版本控制等高效操作,降低高质量数据获取、存储和处理成本,加速AI开发和产品创新。

(0)

相关推荐