当前位置: 首页 > 编程日记 > 正文

完整复现何恺明ICCV获奖论文结果并开源 !(附论文开源代码)

ICCV 作为计算机视觉的顶级会议,2017年共收到2143篇论文投稿,比上一届ICCV2015的1698篇增加了26.2%。共621篇被选为大会论文,录用比例28.9%;poster、spotlight、oral 比例分别为24.61%、2.61%和2.09%。
组委会根据作者署名统计了不同大学的研究数目,清华大学超过CMU、MIT、ICL、斯坦福以及谷歌名列第一,上海交通大学、北京航空航天大学也在前10当中。

1

而此次大会最大的新闻一定是何恺明大神在 ICCV 上拿下了双best paper!继两次荣获 CVPR 最佳论文奖之后,何恺明参与的两篇最新论文又分别摘下 ICCV 2017 的最佳论文奖(Best Paper Award)和最佳学生论文(Best Student Paper Award)两项大奖。
这两篇获奖论文分别是今年 4 月发布的《Mask R-CNN》以及今年 8 月发布的《Focal Loss for Dense Object Detection》,两者都是今年发布,而且相隔仅仅 4 个月。要知道 ICCV 是计算机视觉领域顶级会议之一,且两年举办一次,而何恺明作为两篇论文的第一作者和第四作者,足以证明他的实力。
两篇获奖论文简介:

2

论文简介:我们提出了一个简单、灵活和通用的对象实例分割框架。我们的方法能有效检测图像中的对象,同时为每个实例生成高质量的 segmentation mask。这种被称为 Mask R-CNN 的方法通过添加用于预测 object mask 的分支来扩展 Faster R-CNN,该分支与用于边界框识别的现有分支并行。Mask R-CNN 训练简单,只需在以 5fps 运行的 Faster R-CNN 之上增加一个较小的 overhead。此外,Mask R-CNN 很容易推广到其他任务,例如它可以允许同一个框架中进行姿态估计。我们在 COCO 系列挑战的三个轨道任务中均取得了最佳成果,包括实例分割、边界对象检测和人关键点检测。没有任何 tricks,Mask R-CNN 的表现优于所有现有的单一模型取得的成绩,包括 COCO 2016 挑战赛的冠军。

论文地址:
https://arxiv.org/abs/1703.06870


3

论文简介:目前准确度最高的目标检测器采用的是一种常在 R-CNN 中使用的 two-stage 方法,这种方法将分类器应用于一个由候选目标位置组成的稀疏样本集。相反,one-stage 检测器则应用于一个由可能目标位置组成的规则密集样本集,而且更快更简单,但是准确度却落后于 two-stage 检测器。在本文中,我们探讨了造成这种现象的原因。
我们发现,在训练密集目标检测器的过程中出现的严重的 foreground-background 类别失衡,是造成这种现象的主要成因。我们解决这种类别失衡(class imbalance )的方案是,重塑标准交叉熵损失,使其减少分类清晰的样本的损失的权重。Focal Loss 将训练集中在一个稀疏的困难样本集上,并防止大量简单负样本在训练的过程中淹没检测器。为了评估该损失的有效性,我们设计并训练了一个简单的密集目标检测器—RetinaNet。试验结果证明,当使用 Focal Loss训练时,RetinaNet 不仅能赶上 one-stage 检测器的检测速度,而且还在准确度上超越了当前所有最先进的 two-stage 检测器。

4

我们提出了一种新的损失函数 Focal Loss(焦点损失),这个损失函数在标准的交叉熵标准上添加了一个因子 (1- pt) γ 。设定 γ > 0 可以减小分类清晰的样本的相对损失(pt > .5),使模型更加集中于困难的错误分类的样本。试验证明,在存在大量简单背景样本(background example)的情况下,我们提出的 Focal Loss 函数可以训练出准确度很高的密集对象检测器。

论文地址
https://arxiv.org/abs/1708.02002

大家纷纷表达对恺明大神的崇拜以及对最优秀的学术研究人员表达敬意。与此同时,很多从业者更关心的问题是:什么时候能看到开源代码?
一家AI科技企业——图森未来表示:致敬大神最好的方式,或许就是完整复现论文结果,然后再开源了。他们完整复现了何恺明大神的论文结果(Mask R-CNN 和 Feature Pyramid Network),并将对应代码进行了开源!这也是第一份能够完整复现何恺明大神论文结果的开源代码。
原文发布时间为:2017-10-26
本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关文章:

电子合同的履行_什么是电子合同履行?怎么履行电子合同?

随着互联网产业的发展,许多传统产业都与互联网接轨,人们的传统生活方式也在转变。现在许多人的各种消费都喜欢在方便、快捷的互联网上进行,就连严肃的合同签订也是如此。不过还有很多人不知道什么是电子合同履行,下面律图小编就为…

10月机器学习开源项目Top10

作者 | Mybridge 译者 | 林春眄 整理 | Jane 出品 | AI科技大本营 【导读】过去一个月里,我们对近 250 个机器学习开源项目进行了排名,并挑选出热度前 10 的项目。这份清单的平均 github star 数量高达 1345,涵盖了包括深度学习, Tensorfl…

用SDM架构Cisco IOS ***图文详解全攻略(一)——easy ***

在测试***的过程中发现网上资料少少,于是自己花点力气写几篇普及教程,希望转贴的朋友给与支持,不要忘记署上原创是水煮豆豆的大名,嘿嘿~Cisco给我们提供了管理路由器的很好的安全工具SDM,同时也给我们提供了…

HP 服务器使用 SmartStart CD 引导安装 windows 2008 操作系统

1. 使用SmartStart CD引导安装之前的准备工作:首先,先根据自己的需要配置好RAID,可以使用开机自检检测到阵列卡时按F8进入ORCA的方法配置,也可以使用SmartStart CD中附带的ACU工具配置。其次,需要确认BIOS中启动顺…

parameter缩略语_缩略语

缩略语AccAccelerate(加速)BFBreakerfailure(断路器失灵)BRCBBuferReportControlBloc(有缓存报告控制块)CIDConfiguredIEDDescription(IED实例配置文件)CTCurrenttransformer(电流互感器)DevDevice(设备)ErrError(错误)FstFirst(第一个)GOOSE,GoGenericobjectorientedsubstatio…

[译]怎样用VisualStudio查看非托管代码

(译者:这篇文章作者是一位美国的MVP,这是他的系列文章"Under the cover"的第一篇,文章的本意从最底层的角度来优化代码的性能,并作为阅读作者其他文章的技术基础,这种通过这样的做法虽然初看起来有些过分,但是对读者了解.Net许多底层运作是十分有益的) 我们从使用vi…

盘点互联网大厂AI战略变迁,开发者将怎样pick前进路线?

随着各大企业相继试水“全面 AI”,人工智能在技术落地层面也开始持续深入,泛人工智能时代正在逼近。越来越多的发展趋势表明,未来的人工智能将逐步迈入广泛普及阶段,继而深入影响人类日常的生产生活方式,重塑传统生产结…

druid拦截器_CMS基于SpringBoot+Shiro+Mybatis+Druid+layui后台管理系统

contentManagerSystem后台管理系统简介contentManagerSystem,后台管理系统,采用SpringBoot构建整个项目框架,apacheShiro权限验证,mybatisdruid数据持久化动作,前端采用layui(http://www.layui.com/)展示,整个项目全部通过注解方式进行配置,具体大家可以…

Boost::asio io_service 实现分析

io_service的作用 io_servie 实现了一个任务队列,这里的任务就是void(void)的函数。Io_servie最常用的两个接口是post和run,post向任务队列中投递任务,run是执行队列中的任务,直到全部执行完毕,并且run可以被N个线程调…

叮!你有一份2018英特尔人工智能大会的邀请函,请查收!

AI赋能的数字化应用,作为时代发展的核心驱动力,已经成为改变各行各业的神奇力量。想要准确把握智能时代的发展航向,领航舵手英特尔已向你发出邀请:2018英特尔人工智能大会,欢迎你的到来!11月14日-15日&…

赢得高薪的锦囊三秘诀

作者:jingch 来源:南京竞成 时间:2007-6-27 10:58:40 秘诀一 获得高薪的必备素质通过对一些高收入的外企白领阶层的调查发现,高学历并不与高收入划等号,高薪收入者的基本素质上的优势才是他们获得高薪的关键。概括起…

可疑文件_【国家标准】印刷文件鉴定技术规范点阵式打印文件的同机鉴定

印刷文件鉴定技术规范(GB/T 37232-2018)总则印刷文件同机(同版)鉴定的受理程序、送检材料的标识、检验鉴定程序、送检材料的流转程序及结果报告程序应按GB/T 37234-2018第4章~第8章中相应的要求。印刷文件同机鉴定分为传统制版文件同机鉴定和办公设备机制文件同机鉴定。其中,办…

前端开发神器之ngrok

ngrok能做什么,为什么是前端开发神器? 内网穿透,映射本地开发环境到公网,模拟多终端线上环境。 结合一个很简单的PWA demo,举个简单的例子 1.克隆demo到本地 git clone https://github.com/minimal-xyz/minimal-pwa.gi…

YC陆奇发起知乎第一问:怎样的环境才能让更多AI创业公司成功?

“在人工智能时代,怎样的创新环境和措施能让更多科技驱动的创业公司成功,使其不再是大型科技公司的专利?” 一周前,知乎发起了“2018 互联网洞见者”提问,先后邀请到鹅厂厂长马化腾、“风投女王”徐新、香港科技大学杨…

Linq to SQL 资源

Scott Guthrie 的 Linq to SQL 系列:1)介绍http://weblogs.asp.net/scottgu/archive/2007/05/19/using-linq-to-sql-part-1.aspx 2)定义数据模型http://weblogs.asp.net/scottgu/archive/2007/05/29/linq-to-sql-part-2-defining-our-data-model-classes.aspx 3)查询…

首发|机器学习未来十年:你需要把握的趋势和热点

CSDN 出品的《2018-2019 中国人工智能产业路线图》V2.0 版即将重磅面世! V1.0 版发布以来,我们有幸得到了诸多读者朋友及行业专家的鼎力支持,在此表示由衷感谢。此次 V2.0 版路线图将进行新一轮大升级,力求为读者呈现更全面的中国…

web前端知识点太多_初学web前端,学习方法容易走偏,这是为什么?

一、了解web前端所谓“知己知彼,百战不殆”,在学习web前端之前,还是让我们先了解一下什么是web前端吧!所有用户终端产品与视觉和交互有关的部分,都属于前端开发的领域。从狭义上讲,Web前端就是用HTML、CSS、…

2017-2018 ACM-ICPC, NEERC, Southern Subregional Contest

A. Automatic Door 对于规律的点可以推公式计算&#xff0c;对于噪点则暴力计算&#xff0c;时间复杂度$O(m\log m)$。 #include<stdio.h> #include<iostream> #include<string.h> #include<string> #include<ctype.h> #include<math.h> #…

正则过滤非法字符

小写英文&#xff1a;大写英文&#xff1a;任意数字&#xff1a;限2位小数&#xff1a; 如: 123.12日  期&#xff1a; 如: 2002-9-29任意中文&#xff1a;部分英文&#xff1a; 范围: a,b,c,d,e部分中文&#xff1a; 范围: 一二三四五六七八九十有关正则表达式 ?.只能输入数…

emoji 乱码_这个自制emoji的网站,让你成为永远不输的斗图王者

作为表情界的元老级人物&#xff0c;不管是苹果官网输入法、微信官方表情还是各个主流输入法里&#xff0c;我们都可以从里面找到大量 emoji 表情。然鹅……就算这么多表情&#xff0c;小帮每次发 emoji 时还有有些选择困难。因为翻遍所有表情&#xff0c;都没法找到合适的啊&a…

[vijos1234]口袋的天空最小生成树

题目链接&#xff1a;https://vijos.org/p/1234 白天刚刚写完prim的算法&#xff0c;晚上就心血来潮的打了一道最小生成树的题 虽然有题解说可以用prim做&#xff0c;但是这道题明显是加最小的边&#xff0c;感觉kruskal方便多了 但是愉快的是我竟然不是一次过&#xff0c;最后…

南开大学提出最新边缘检测与图像分割算法,精度刷新记录(附开源地址)

作者 | 刘云、程明明、胡晓伟、边佳旺等 译者 | 刘畅 整理 | Jane 出品 | AI科技大本营 近日&#xff0c;南开大学媒体计算实验室提出的最新边缘检测和图像过分割&#xff08;可用于生成超像素&#xff09;被 IEEE PAMI 录用。研究的第一作者也发微博称&#xff1a;“这是第…

修改Vista系统目录权限

例如C:\Windows\System32\DriverStore\FileRepository1. 修改目录所有者右键菜单->Properties->Security->Advanced->Owner->Edit->Other users or groups...输入用户名并确定&#xff0c;勾选Replace owner on subcontainers and objects&#xff0c;一路确…

gitlab安装各种坑

架构&#xff1a;源码安装, 数据库用mysql,网站用nginx 坑一.nginx报错 122016/07/19 09:26:11 [crit] 3881#0: *10 connect() to unix:/home/git/gitlab/tmp/sockets/gitlab-workhorse.socket failed (13: Permission denied) while connecting to upstream, client: 192.168.…

当代的设计潮流是什么_解码“潮流合伙人”IP生意经

每经记者&#xff1a;杜蔚 每经编辑&#xff1a;董兴生11月18日&#xff0c;备受期待的《潮流合伙人2》在成都举办了FOURTRY FAMILY PARTY新品发布日活动&#xff0c;节目的品牌主理人陈伟霆&#xff0c;合伙人欧阳娜娜、范丞丞等纷纷亮相现场&#xff0c;吸引众多人前来围观。…

Loonframwork到SWT的移植测试(JAVA GAME TEST SOURCE)

愚以为&#xff0c;用SWT作界面&#xff0c;是一种在用Java写VB的体验。本周心情极度恶劣&#xff0c;一直不想说话&#xff0c;也不想写新代码&#xff0c;郁闷中尝试了一下将Loonframework的代码移植到SWT。&#xff08;其实我觉得AWT,SWT,Swing用那个真的要根据需求决定&…

百度大脑发挥AI“头雁效应” 王海峰:在AI时代共同推动社会智能化升级

11月1日&#xff0c;百度大脑作为2018百度世界大会的第一弹登场。 近期国家层面也高度重视人工智能的发展现状和趋势&#xff0c;认为加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。人工智能技术具有溢出带动性很强的“头雁”效应。百度高…

bat脚本如何自动输入y_Linux系统如何设置开机自动运行脚本?

大家好&#xff0c;我是良许。 在工作中&#xff0c;我们经常有个需求&#xff0c;那就是在系统启动之后&#xff0c;自动启动某个脚本或服务。在 Windows 下&#xff0c;我们有很多方法可以设置开机启动&#xff0c;但在 Linux 系统下我们需要如何操作呢&#xff1f; Linux 下…

form表单的action提交写到js中来,同时onclick事件也写在js中来。其action也可以通过ajax来提交的。...

假如你现在还在为自己的技术担忧&#xff0c;假如你现在想提升自己的工资&#xff0c;假如你想在职场上获得更多的话语权&#xff0c;假如你想顺利的度过35岁这个魔咒&#xff0c;假如你想体验BAT的工作环境&#xff0c;那么现在请我们一起开启提升技术之旅吧&#xff0c;详情请…

Win32.Lioten.SG病毒

病毒名称&#xff1a;Win32.Lioten.SG 疯狂性&#xff1a;低 破坏性&#xff1a;中 普及度&#xff1a;中 Win32.Lioten.SG病毒描述&#xff1a; Win32.Lioten.SG是一种通过网络共享传播的蠕虫&#xff0c;还会利用Windows漏洞进行传播&#xff0c;并利用IRC控制后门。 Lioten经…