上海交大:我们做了一个医疗版MNIST数据集,发现常见AutoML算法没那么好用
第一时间获取价值内容
上海交大研究人员创建新型开放医疗图像数据集 MedMNIST,并设计「MedMNIST 分类十项全能」,旨在促进 AutoML 算法在医疗图像分析领域的研究。
项目地址:https://medmnist.github.io/
论文地址:https://arxiv.org/pdf/2010.14925v1.pdf
GitHub 地址:https://github.com/MedMNIST/MedMNIST
数据集下载地址:https://www.dropbox.com/sh/upxrsyb5v8jxbso/AADOV0_6pC9Tb3cIACro1uUPa?dl=0
教育性:该数据集中的多模态数据来自多个具备知识共享许可证的开放医疗图像数据集,可以用作教育目的。
标准化:研究人员对数据进行预处理,将其转化为相同的格式,因此用户无需具备背景知识即可使用。
多样性:多模态数据集涵盖多种数据规模(从 100 到 100,000)和任务(二分类 / 多分类、有序回归和多标签)。
轻量级:图像大小为 28 × 28,便于快速设计原型和试验多模态机器学习与 AutoML 算法。
赞 (0)