数据集查找神器!1000 个机器学习常用数据集都汇总在这了
“想用算法解析世界,算法工程师却在数据里消耗”如果脑海中的共鸣可以发声,那么现在每位工程师都在咆哮
在算法工程师的工作中,数据查找处理覆盖了一大片灰色时光,占据正常工作时间80%以上
有需求就会有供给,针对该痛点,Graviti为各位算法工程师提供了一站式解决方案
Graviti OpenDatasets
海量优质公开数据集搜索,1000+优质数据集,30+应用场景,20+标注类型,10+数据格式
免费获取,快速获取与使用数据集,助力AI开发落地
便捷云端使用,通过开发者工具,无需下载即可云端读取数据
▲丰富多元的数据集
Open Datasets 01
快捷数据集查找与筛选
在Open Datasets,您可以通过数据集的名称联想检索、应用场景筛选、标注类型筛选、推荐、更新时间及热度筛选,轻松找到所需数据集
数据应用场景多元,标注类型划分规整简洁
30+种AI应用场景
2D/3D目标检测、图像分割、图像分类、目标跟踪、OCR、姿态估计、无人驾驶、智慧零售、机器人等
20+种标注类型
2D分类、2D多边形、2D矩形等
多种数据格式
点云、图像、视频序列、三维模型等
Open Datasets 02
数据的结构化描述
Open Datasets拥有明晰的信息展示方式,通过将数据的应用场景、标注类型、数据概要信息及协议信息结构化,方便您迅速定位数据关键信息,提高您的阅读体验
Open Datasets 03
标注数据在线可视化
在Open Datasets,您无需下载,即可在数据集详情页在线查看标注情况及标签分布,掌握细节,所见即所得
▷ 标注数据可视化
▷ 标签分布可视化
支持列表、柱状图、饼图(滑动查看)
Open Datasets 04
免费获取,在线使用
通过Fork数据集,您即可通过开发者工具,使用Python SDK、CLI或Open API来在线管理、读取数据,无需下载、解压、转换数据结构,即可直接对接TensorFlow和Pytorch等AI训练框架。
同时在每个数据集的详情页的代码板块,我们提供了读取数据的代码,您可直接复制使用
我们为社区用户免费提供非结构化数据云端管理SaaS
>>Fork后,您可在“我的数据集”管理您Fork的数据集
▷ 灵活发布与切换版本,清晰追踪迭代过程
▷ 支持通过标签筛选,使用数据
▷ 数据在线可视化,实时查看
▷ 基于角色的权限管理与使用分离
Open Datasets 05
畅享海外数据高速下载
如果您想下载数据集至本地,Graviti也为您提供高速稳定的下载服务。将全球资源Host至国内镜像,无需VPN访问,满带宽极速下载。与进入海外官网下载相比,Graviti至少提速100%
>>选择Open Datasets,告别繁琐的登录注册流程,告别令人抓狂的下载时长!
▲普通带宽下载海外数据,实测就有10+MB/s的速度
Open Datasets 06
完善的社区支持模块
面对更多元的个性化用户需求,Graviti为社区用户提供问题与需求的反馈渠道,一对一针对性回应、跟进、解决您的需求
官网反馈入口
我们重视每一条用户反馈
关于「格物钛」
格物钛定位为面向机器学习的数据平台,帮助AI开发者解决日益增长的非结构化数据难题。借助非结构化数据管理平台TensorBay和开源数据集社区Open Datasets,机器学习团队和个人可进行数据管理、查询、协同、可视化和版本控制等高效操作,降低高质量数据获取、存储和处理成本,加速AI开发和产品创新。