上海交大发布 MedMNIST 医学图像分析数据集 新基准
来源 | HyperAI超神经
责编 | 晋兆雨
头图 | 付费下载于视觉中国
内容概要:医学图像分析是一个非常复杂的跨学科领域,近日上海交通大学发布了 MedMNIST 数据集,有望促进医学图像分析的发展。
关键词:医学图像分析 公开数据集
令人头秃的医学图像分析
医学图像分析是一个公认的「老大难」课题。
首先它是一个跨学科领域,要求从业者具备多方面知识背景,即使你是钻研计算机视觉的专业人士,又或者是一个临床医学从业者,那你充其量只迈出了进行医学图像分析的半只脚。
乐观估计,经过多年的学习和研究,你终于掌握了计算机视觉和临床医学的双向技能,那接下来的操作也能让你愁到头秃,因为这些数据来源五花八门,有 X 射线、CT、超声……分析处理这么多个不同模式的非标准数据集,也太难了!
这还没完,深度学习虽然在医学图像分析的研究和应用中,已经占据主导地位,但模型调整需要的人力成本太高了,AutoML 好使是好使,但是目前基本没有用于医学图像分类的 AutoML 基准。
MedMNIST 分类十项全能一览
医学图像分析困难重重,然而上海交通大学近期发布的 MedMNIST 数据集,则为终结这些老大难问题,带来了一大利器。
10 个公开数据集、45 万张图像重新整理
MedMNIST 是一个包含 10 个医学公开数据集的集合,且全部数据均已经过预处理,将其分为包括训练集、验证集、测试子集的标准数据集。数据来源包括 X 射线、OCT、超声、CT 等不同成像模式,得到了同一病灶的多模态数据。与 MNIST 数据集一样,MedMNIST 可以在轻量级 28*28 图像上执行分类任务。
十个数据集的数据模式、适用任务及图像数量
MedMNIST 具有以下特点:
教育性:多模态数据来自于多个公共医学图像数据集,采用知识共享(CC)许可协议或自由许可协议,方便教学使用。
标准化:全部数据已经预处理成相同的格式,降低准入门槛,任何人都可以使用。
多样性:多模态数据集涵盖了不同的数据模式,数据规模从 100 到 100,000 都支持,任务类型也丰富为二元分类、多元分类、有序回归和多标签。
轻量级:28*28 的图像尺寸便于迅速进行原型设计,对多模态机器学习和 AutoML 算法进行快速迭代和实验。
MedMNIST Dataset
发布机构:上海交通大学
包含数量:454,591 个图像数据
数据格式:NPZ
数据大小:654 MB
发布时间:2020 年 10 月 28 日
下载地址:http://dwz.date/dew2
十项全能大法好,打造 AutoML 新基准
受《医学分割十项全能》(Medical Segmentation Decathlon)的启发,上海交通大学的科研人员还发布了《MedMNIST 分类十项全能》 (MedMNIST Classification Decathlon),作为医学图像分类中的轻量级 AutoML 基准。
科研人员用 MedMNIST 分类十项全能,评估了在全部 10 个数据集上的算法性能,并采取了其他几个 baseline 方法与该基准进行对比,这些方法包括 ResNets(18、50)、auto-sklearn、AutoKeras、Google AutoML Vision。
MedMNIST 在 AUC 和 ACC 等指标上的性能一览
实验结果表明,针对全部 10 个数据集,都能取得很好的泛化性能的算法,在实验中并不存在。该实验对于探索在不同数据模式、任务类型和数据规模上,进行很好地泛化的 AutoML 算法,意义重大。
MedMNIST 分类十项全能基准测试,将促进未来医学图像分析 AutoML 的相关研究。
相关论文:
https://arxiv.org/pdf/2010.14925.pdf
开源地址:
https://github.com/MedMNIST/MedMNIST
更多精彩推荐
AI 隐身术,能让物体在视频中消失的魔法
太扎心!人艰不拆!16 个程序员专属笑话讲给你听
九问国产操作系统,九大掌门人首次同台激辩
一文读懂机器学习“数据中毒”
NLP实战:利用Python理解、分析和生成文本 | 赠书
相关文章:

VS 2010中对WPF4有哪些多点触摸支持?
随着多点触摸输入和操作处理支持的引进, WPF 4提供了一个极棒的方式,可在Windows 7中使你的客户端应用大放光彩,新的特性包括:UIElement上的多点触摸操作、惯性(漫游(Pan)、缩放(Zoo…

业务组件架构的思考
在iOS开发中,我们接触比较多的是MVC架构,下面我们先来分析一下MVC架构。 1.MVC MVC是一种软件架构模式,在1978年由Trygve Reenskaug提出,它把软件系统分为三个基本部分:模型(Model)、视图&#…
强化学习:10种真实的奖励与惩罚应用
作者 | Patrycja翻译 | Katie,责编 | 晋兆雨出品 | AI科技大本营头图 | 付费下载于视觉中国在强化学习(Reinforcement Learning)中,对代理进行奖励和惩罚机制的培训。代理的正确行为会得到奖励,而错误的行为会受到惩罚…

PHP feof() 函数读文件的使用
(PHP 4, PHP 5) feof — 测试文件指针是否到了文件结束的位置 如果服务器没有关闭由 fsockopen() 所打开的连接,feof() 会一直等待直到超时而返回TRUE。默认的超时限制是 60 秒,可以使用 stream_set_timeout() 来改变这个值。 文件指针必须是有效的&a…

批处理解决“易语言难题”
为什么80%的码农都做不了架构师?>>> 发现还没有Win批处理的,也就是DOS,我来凑个热闹,哈哈~ maxos 汇总贴 APPLEUFO 原题链接 不罗嗦,上代码啦: echo off set c_title批处理…

\r与\n有何差别,编码的时候应该怎样使用
差别: \r: 全称:carriage return (carriage是“字车”的意思。打印机上的一个部件)简称:return缩写:rASCII码:13作用:把光标移动到当前行的最左边\n: 全称:new line别名…
深度学习中的注意力机制(一)
作者 | 蘑菇先生来源 | NewBeeNLP头图 | CSDN下载自视觉中国目前深度学习中热点之一就是注意力机制(Attention Mechanisms)。Attention源于人类视觉系统,当人类观察外界事物的时候,一般不会把事物当成一个整体去看,往往…

Hibernate 异常org.hibernate.LazyInitializationException: could not initialize prox
Hibernate的Lazy初始化1:n关系时,必须保证是在同一个Session内部使用这个关系集合,不然Hiernate将抛出异常。 两种处理方法: 一、这是延时加载的问题,把有关联的所有pojo类,在hibernate.cfg.xml文件中。一般在many-to-…

XHTML基础问答
作者:阿捷 2004-6-26 1:43:36本文是2002年为硅谷动力网站翻译的稿件。当时xhtml1.0刚刚开始被设计师所接触,所以有下面这个基础问答。 HTML语言是我们建立网页的工具,从它出现发展到现在,规范不断完善,功能越来越强。…
958毕业,苦学Java,竟被二本毕业生吊打!网友:确实厉害!
最近收到一位中型公司 HR 的反馈,她说,我推荐的一个普通本二毕业生在校招面试中表现非凡,当时两个人争抢一个名额,他竟然完胜另一位 985 毕业生。普通本二毕业生对公司的技术提问对答如流,曾在小公司实习,做…

css布局中的居中问题
css布局中的居中问题 作者:阿捷 2004-7-5 14:35:49#sample{HEIGHT:240px;WIDTH:400px;BACKGROUND: url(http://www.w3cn.org/style/001/logo_w3cn_194x79.gif) #CCC no-repeat center;} 如何使DIV居中 主要的样式定义如下: body {TEXT-ALIGN: center;…

领域驱动设计_软件核心复杂性应对之道
领域驱动设计_软件核心复杂性应对之道转载于:https://www.cnblogs.com/MarvinGeng/archive/2013/02/21/2920968.html
谈谈Boost网络编程(2)—— 新系统的设计
写文章之前。我们一般会想要採用何种方式,是“开门见山”,还是”疑问式开头“。写代码也有些类似。在编码之前我们须要考虑系统总体方案,这也就是各种设计文档的作用。在设计新系统之初,我基本的目的是:保证高效率&…
64岁Python之父退休失败,正式加入微软搞开源
来源 | CSDN今天,64岁的Python 之父 Guido van Rossum 在 Twitter 上正式宣布,退休太无聊,如今加入了微软开发者部门。Guido van Rossum 去年宣布退出 Python 核心决策层事实上,近几年来,随着人工智能的飞速发展&#…

Java实现HTTP文件下载(转)
文章出自: http://www.360doc.com/content/12/1218/17/2718300_254818081.shtml 本人用这种方法解决了工作中遇到的问题,再次谢谢文章的作者. 序言 许多用户可能会遇到这样的情况:在网站上发现一个很好的资源,但是这个资源是分成了很多个文件存放的&…

初学web标准的几个误区
初学web标准的几个误区作者:阿捷 2004-7-7 11:37:11非常高兴地看到很多设计师开始关注和尝试使用web标准制作网页。但从网友们的问题和制作中发现几个问题,在这里特别提醒一下: 1.不是为了通过校验才标准化。 web标准的本意是实现内容(结构…

nginx系列:nginx反向缓存代理详解
小生博客:http://xsboke.blog.51cto.com如果有疑问,请点击此处,然后发表评论交流,作者会及时回复。-------谢谢您的参考,如有疑问,欢迎交流一、 代理和nginx相关概念1. 代理类型正向代理:代理局域网对internet的连接请求反向代理&…

编辑PDF文档,Word 2013可以是您的选择
题外话:记得刚进公司的时候,几乎所有的培训文档都是PDF、标准文档,公司使用的软件是Adobe Acrobat 5.0(不知道多少钱,呵呵),软件当然是购买正版的;去年,公司购买了新版本…

中国人工智能学会2020年度优秀科技成果出炉,百度文心ERNIE入选
11月14日,由中国人工智能学会(CAAI)主办的2020第十届中国智能产业高峰论坛(CIIS 2020)正式开幕,CAAI理事长戴琼海院士、何积丰院士、何友院士、王恩东院士、陆军院士等多位中外院士、专家齐聚嘉兴南湖&…

web标准,我们去向何方?一些想法...
web标准,我们去向何方?一些想法...作者:阿捷 2004-7-5 0:52:42原文作者:Veerle 原文出处:veerle.duoh.com 原文发表时间:2004年6月14日 译者注:本文是"你应该关注web标准的真正原因"…

事件源ES的优势
多年来,开发人员实现持久性使用传统的创建、读取、更新、删除(CRUD)模式。正如前面介绍的,如果采购模型实现持久性存储状态更改为历史事件捕获业务活动发生之前写的数据存储。这将事件存储机制,允许他们被聚合,或者放在一个组与逻辑边界。事件采购的模式之一,使并发、分布式系统…

你应该关注web标准的真正原因
你应该关注web标准的真正原因作者:阿捷 2004-7-4 2:28:39原文作者:Andrei Herasimchuk 原文出处:designbyfire.com 原文发表时间:2004年6月11日 译者前言:这是一篇让人震惊的文章。作者的分析深刻,文笔犀…
为什么我们需要开源的系统芯片?
作者 | bunnie译者 | 弯月,编辑 | 杨碧玉来源 | CSDN(ID:CSDNnews)现代的小型电子产品往往基于某个高度集成的芯片构建,这种芯片称为“系统芯片”(System on aChip,缩写:SoC…

InnoDB和MyISAM区别
MySQL作为当前最为流行的免费数据库服务引擎,已经风靡了很长一段时间,不过也许也有人对于MySQL的内部环境不很了解,尤其那些针对并发性处理的机制。今天,我们先了解一下MySQL中数据表的分类,以及它们的一些简单性质。 …

图书管理系统5W1H
Who 图书管理员 When 图书管理员在图书馆借阅期间管理用户的借书还书,非借阅时间管理后台图书、管理用户信息 Where 借书台、办公室 What 一个图书管理系统,能实现图书的借书还书操作、管理后台图书信息、管理用户信息 Why 能够方便快捷的实现图…
程序员奶爸用树莓派制作婴儿监护仪:哭声自动通知,还能分析何时喂奶
作者 | Fabio Manganiello译者 | 弯月,责编 | 杨碧玉头图 | CSDN 下载自东方 IC来源 | CSDN(ID:CSDNnews)首先,告诉大家一个好消息,我当爸爸了!我不得不暂停一下我的项目来承担一些育儿的重任。…

python快速小教程
http://www.cnblogs.com/vamei/archive/2012/09/13/2682778.html

web标准的投资回报
web标准的投资回报(ROI)作者:阿捷 2004-7-6 0:17:49原文作者:D. Keith Robinson 原文出处:asterisk 原文发表时间:2004年6月1日 用web标准开发能够带来实际利益,这一点还有人怀疑吗? 如果有,…

使用javascript让项目支持热插拔
2019独角兽企业重金招聘Python工程师标准>>> 突然想起之前做过的一个小项目,项目虽小,需求却不小,要求解析特定格式的字符串,并且特定格式并非一成不变,想要一套系统能够支持解析多变的规则且更改规则时不能…

设计模式:状态模式(State Pattern)
作者:Wang Juqiang 创建于:2012-07-16 出处:http://www.cnblogs.com/wangjq/archive/2012/07/16/2593485.html 收录于:2013-03-01 结构图 意图 允许一个对象在其内部状态改变时改变它的行为。对象看起来似乎修改了它的类。 适用性…