当前位置: 首页 > 编程日记 > 正文

FoveaBox:目标检测新纪元,无Anchor时代来临 | 技术头条

640?wx_fmt=jpeg


作者 | CV君

转载自我爱计算机视觉(ID:aicvml)


目标检测的任务是“分类”并从图像中“定位”出物体,但长久以来,该领域的工作大多是这样:生成可能包含目标的区域,然后在该区域提取特征并分类。


显然,人眼并不是这样工作的。


人眼可以直接定位出物体,也就是对人眼来说发现目标的过程,定位和分类是一体的。


现代深度学习的方法,代表性的包括二阶段的Faster R-CNN和一阶段的SSD、RetinaNet等,使用在特定尺度图像中预先定义大量的目标框(Anchors)的方法,降低了计算量。但这也带来了超参数增加、人为调参过拟合评测数据集、前后景目标类别不平衡等问题。


但很有意思的是,近半年来,尤其以CornerNet的出现为代表,越来越多的工作开始尝试摆脱Anchors的设计。


CV君相信,无Anchor的目标检测已经悄然成为该领域的重要发展方向。


今天跟大家分享的FoveaBox则是该方向最新的成果(昨天刚刚传到arXiv),针对的是通用目标检测领域,算法方案简单,结果达到state-of-the-art,代码亦将开源,方便后续其他学者跟进,发展空间极大。


深度神经网络可以自己回归出目标包围框,Anchor并非必要,目标检测“可能”要就此进入新纪元了!


下面是论文《FoveaBox: Beyond Anchor-based Object Detector》的作者信息:


640?wx_fmt=jpeg


作者分类来自清华大学、北京国家信息科技研究中心、字节跳动AI实验室、宾夕法尼亚大学。


感谢~


下图为无Anchor的FoveaBox算法与RetinaNet在COCO数据集上的结果比较,RetinaNet通过改变anchors个数,精度有变化,但FoveaBox更胜一筹。


640?wx_fmt=jpeg


算法思想


FoveaBox的动机来自人眼的中央凹:视野中心(物体)具有最高的视力。

(物体的位置信息能够从中心反应出来——CV君的理解)

下图展示了FoveaBox目标检测的基本思想,对于可能存在目标的每个输出空间位置,FoveaBox直接预测所有目标类别存在的置信度和边界框。


640?wx_fmt=jpeg


FoveaBox是在RetinaNet目标检测网络基础上做的改进,我们先来看看RetinaNet的网络架构。


如下图,RetinaNet利用了特征金字塔网络检测目标,对于金字塔的每一层,都后接class  + box  子网络。最右侧上半部分为class子网络,下半部分为box子网络。



640?wx_fmt=jpeg


下图是FoveaBox网络的改进,class 子网络计算的是每个输出位置分别存在不同类别目标的置信度,box子网络则是直接计算每个输出位置的与类别无关的目标包围框(左上和右下顶点坐标)。


640?wx_fmt=jpeg


在论文第三部分从骨干网、训练时目标的尺度分配、训练时目标位置信息内陷、box 预测、网络优化和推断等详细说明了训练和推断的细节。


实验结果


作者首先研究了,FoveaBox算法与RetinaNet在变化anchor密度、目标宽高比后的精度结果,如下图(a)(b),FoveaBox比RetinaNet的最好结果还好。


因为FoveaBox具有自己生成候选目标区域的能力,作者将其与RPN网络相比较,下图(c),发现其生成的目标候选框比RPN的质量更高!


640?wx_fmt=jpeg

640?wx_fmt=jpeg


下面表格展示了,FoveaBox与目前两阶段和一阶段state-of-the-art目标检测算法在COCO数据集上检测结果比较,FoveaBox取得了几乎最好的结果,仅三个指标略低于Cascade R-CNN,但作者称许多高级目标检测技巧,FoveaBox还没有使用,后续还有提高的潜力。


640?wx_fmt=jpeg


下图为FoveaBox与RetinaNet的检测结果示例,可见在宽高比变化较大的目标上,FoveaBox取得了更好的结果。


640?wx_fmt=jpeg


论文地址:

https://arxiv.org/pdf/1904.03797v1.pdf


作者称代码将开源,地址暂未公布。


(本文为AI科技大本营转载文章,转载请联系原作者)


实习生招募


640?wx_fmt=jpeg


推荐阅读:

  • 详解爱奇艺ZoomAI视频增强技术的应用 | 公开课笔记

  • DOTA2人机决战:2:0!OpenAI击败世界冠军OG

  • Python的10个“秘籍”,这些技术专家全都告诉你了

  • 从头构建恶性肿瘤检测网络 | 100行Python代码理解深度学习关键概念

  • 马云再谈 996:真正的 996 与被剥削无关

  • 漫画:图的 “最短路径” 问题 | 技术头条

  • 从 0 到管理 200 人,这位程序员是如何做到的? | 程序员有话说

  • 4000万假币流入波场, 发生在凌晨的BTT假币攻击事件始末及细节披露

  • 程序员为什么都爱穿冲锋衣?(最全总结)


640?wx_fmt=png


点击“阅读原文”,查看更多精彩文章。

相关文章:

【Ubuntu】安装中文输入法、终端不支持中文的解决方法

一、中文输入法安装 1、安装汉语语言包 sudo apt install fcitx sudo apt install language-pack-zh-hans2、安装google拼音输入法 sudo apt install fcitx-googlepinyin安装完毕后,重启或者退出登陆 3、安装sun-pinyin输入法 sudo apt install fcitx-sunpinyi…

CCNA 第一章 网际互联

第一章 网际互联 路由器知识点: 1、默认时,路由器不转发任何广播包和组播包。 2、路由器使用逻辑地址,逻辑地址在网络层的包头中,用来决定将包转发到的下一跳路由器。 3、路由器可以使用管理员创建的访问表来控制被允许进入或流出…

【Cmake】执行cmake命令时报错:No XSLT processor found

一、问题描述 在ubuntu中,在生成Doc(文档)中,执行cmake命令时报错:No XSLT processor found 二、原因查找 google该错误信息,原因是确实ubuntu中没有安装 xsltproc 三、解决方法 安装 xsltproc sudo apt install xsltproc四…

一张“黑洞”需要拍两年?有了它或许就不会让大家等那么久了

只闻其名,不见其形,从小听到大的”黑洞“,终于让我们在有生之年见到了它的真容,只能说幽暗的宇宙美丽也调皮,长久以来人类关于黑洞的探索,在这一刻终于得到影像印证。相信很多人心中都有一个疑惑&#xff0…

如何在一场面试中展现你对Python的coding能力?| 技术头条

点击上方↑↑↑蓝字关注我们~作者 | wLsq 来源 | Python数据科学(ID:PyDataScience)如果你已经通过了招聘人员的电话面试,那么下面正是该展现你代码能力的时候了。无论是练习,作业,还是现场白板面试,这都是…

Django web : CSRF verification failed. Request aborted.

错误标题:CSRF verification failed. Request aborted. 错误描述: HelpReason given for failure:CSRF cookie not set.In general, this can occur when there is a genuine Cross Site Request Forgery, or when Djangos CSRF mechanism has not been …

分享一个PC端六格密码输入框写法

如图。我们一般做商城类的项目不免会用到支付密码输入框&#xff0c;我研究了下并决定发上来&#xff0c;也当作是自己成长路上的一点小小的记录。本次介绍的是基于vue的项目 html&#xff1a; <template><div classam_payPwd :id"ids_${id}"><input …

【数据库】sqlite中PRAGMA命令说明

关于sqlite中PRAGMA的说明网上已经有很多了&#xff0c;这里不再复制粘贴&#xff0c;只把内容最全的网址连接记录一下&#xff1a; 官网说明&#xff08;英文&#xff09;&#xff1a;https://sqlite.org/pragma.html 中文翻译&#xff0c;参见博客&#xff1a;https://www.i…

思科交换机各类型中字母的意思?

24TC-L中各字母的意思分别指? 24TT-L中第二个T的意思? 2960和2960G的区别&#xff1f;基中G是什麽意思? F0/1和G0/1区别&#xff1f; 24代表是24个网络接口 第一个T表示TX&#xff0c;也就是所谓RJ-45的类型&#xff08;指这个24个接口都是RJ-45&#xff0c;若是P的话&#…

医生还未失业,IBM Watson已跌入深渊 | 极客头条

点击上方↑↑↑蓝字关注我们~作者 | Eliza Strickland译者 | Major编辑 | 琥珀出品 | AI 科技大本营&#xff08;公众号ID&#xff1a;rgznai100&#xff09;导语&#xff1a;2011 年&#xff0c;Jeopardy! 挑战赛的成功&#xff0c;让外界看到 IBM 的人工智能给医学带来的革命…

【Qt】Qt容器总结

目录 一、容器类1、顺序容器2、关联容器二、Qt容器特点三、迭代器1、Jave样式的迭代器(效率略低)2、SLT样式的迭代器注意: 由于Qt的容器是写时复制的,因此非const访问器从本质上讲更加昂贵, 因为它们必须首先检查是否需要复制基础数据(并在必要时进行复制)。 因此,在Qt…

Java5线程并发库之保障变量的原子性操作

为什么80%的码农都做不了架构师&#xff1f;>>> java.util.concurrent.atomic 首先我们看java.util.concurrent.atomic包&#xff0c;它主要是提供一些为各种数据类型变量提供原子性操作的类。 AtomicInteger 比如我们来看AtomicInteger类&#xff0c;大家在写程序…

EIGRP OSFP 利用NULL0接口防止路由环路 Loopback Null0接口揭秘

在EIGRP中&#xff0c;只要发生总结就会在路由表中自动产生一条指向NULL0的路由条目&#xff0c;这条路由的直接意思是&#xff1a;匹配这条路由的数据包会被路由器丢掉。它的目的是为了避免在某些情况下产生路由环路。 以第三四学期的中文书P86中的图4-15为例做个说明&#xf…

【C++】C++11 STL算法(一):非修改序列操作(Non-modifying sequence operations)

目录一、all_of、any_of、none_of&#xff1a;1、官方说明2、谓词3、STL算法对谓词的说明4、谓词的五种模式5、all_of &#xff08;C 11&#xff09;6、any_of &#xff08;C 11&#xff09;7、none_of&#xff08;C 11&#xff09;8、官方demo&#xff1a;二、for_each1、原型…

Python openpyxl 之 Excel 文档简单操作

背景&#xff1a;生活中常常因日常工作&#xff0c;在记录统计方面需频繁处理较多 Excel 表格&#xff0c;这部分工作虽可由人工完成&#xff0c;但这样会显得有些繁琐且可能存在偏差&#xff0c;遂闲时查阅了是否有相关基于python处理Excel表格的学习文档&#xff0c;后获知这…

售价910元!周志华等人英文新书《演化学习》出炉!

点击上方↑↑↑蓝字关注我们~整理 | 琥珀出品 | AI 科技大本营&#xff08;公众号ID&#xff1a;rgznai100&#xff09;关于人工智能教育&#xff0c;从学生培养方案&#xff0c;到课程设置、教材&#xff0c;甚至是授课老师&#xff0c;全国各大高校正探索一条新道路。先是从去…

linux 查看 文档 不显示注释 命令

原文&#xff1a;http://www.weiruoyu.cn/?p661 最近发现一个很好的命令&#xff0c;就是linux 查看 文档 不显示注释 的命令[rootlocalhost ha.d]# cat ha.cf |grep -v ^# logfile /var/log/ha-log 转载于:https://blog.51cto.com/weiruoyu/705840

【C++】C++11 STL算法(二):修改序列的操作(Modifying sequence operations)

目录一、copy、copy_if1、原型&#xff1a;2、说明&#xff1a;3、官方demo二、copy_n1、原型&#xff1a;2、说明&#xff1a;3、官方demo三、copy_backward1、原型&#xff1a;1、说明&#xff1a;1、官方demo四、move1、原型&#xff1a;2、说明&#xff1a;3、官方demo五、…

ECharts测量图,功率图

/*** 测量图&#xff0c;功率图1&#xff0c;仪表盘*/ mainpage.prototype.initEcharsGLT1 function(oneJZ){ //if(myChartGLT1 null && myChartGLT1 ! "" && myChartGLT1 ! undefined) {myChartGLT1.dispose(); //每次加载之前清除之前的echar…

北京智源人工智能研究院启动“智源学者计划”,与旷视发布首个智源联合实验室

4月16日&#xff0c;北京智源人工智能研究院与中国人工智能领军企业旷视召开“智源学者计划暨联合实验室发布会”。北京市科委副主任张光连&#xff0c;海淀区委常委、副区长李俊杰&#xff0c;以及来自科技部、北京市科委、海淀区人民政府、朝阳区人民政府、中关村管委会&…

配置隧道模式的IPSec.×××

一、拓扑及IP配置 二、配置清单 R1#show run Building configuration... Current configuration : 1449 bytes ! upgrade fpd auto version 12.4 service timestamps debug datetime msec service timestamps log datetime msec no service password-encryption ! hostname R1 …

【C++】C++11 STL算法(三):分隔操作(Partitioning operations)、排序操作(Sorting operations)

目录分隔操作&#xff08;Partitioning operations&#xff09;一、is_partitioned1、原型&#xff1a;2、说明&#xff1a;3、官网demo二、partition1、原型&#xff1a;2、说明&#xff1a;3、官方demo三、partition_copy1、原型&#xff1a;2、说明&#xff1a;3、官方demo四…

浪潮发布重磅产品“元脑”,专注AI全栈能力输出

整理 | 一一出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;4月16日&#xff0c;以“智慧凝聚”为题的IPF2019浪潮云数据中心合作伙伴大会在上海举办。大会重点聚焦浪潮“智慧计算”战略&#xff0c;以AI计算力和创新力&#xff0c;联接、承载、赋能合作伙伴。为了布…

React+Redux+中间件

MVVM是Model-View-ViewModel的缩写。mvvm是一种设计思想。Model 层代表数据模型&#xff0c;也可以在Model中定义数据修改和操作的业务逻辑&#xff1b;View 代表UI 组件&#xff0c;它负责将数据模型转化成UI 展现出来&#xff0c;ViewModel 是一个同步View 和 Model的对象。在…

ピエタ~幸せの青い鳥~相关

先打全所有升级补丁 不然没有end4 补丁下载页 4个end出现方法 只看律视角 选项任意→end1 只看愛视角 选项任意→end2 检查一下 这两个流程的CG是否收全了 开启唯视角以后有些CG是找不回的 只看唯视角 选项任意→end3 只看唯视角 最后一个选项选“唯” 此后只要律或愛的视角开…

【C++】C++11 STL算法(四):二分查找法(Binary search operations)、合并操作

目录一、lower_bound1、原型&#xff1a;2、说明&#xff1a;3、官方demo二、upper_bound1、原型&#xff1a;2、说明&#xff1a;3、官方demo三、binary_search1、原型&#xff1a;2、说明&#xff1a;3、官方demo四、equal_range1、原型&#xff1a;2、说明&#xff1a;3、官…

腾讯开源分布式NoSQL存储系统DCache | 技术头条

作者 | 山宝银&#xff0c;腾讯后台高级工程师&#xff0c;专注于分布式 NoSQL 存储领域的技术研发工作&#xff0c;参与腾讯多个自研存储系统的开发&#xff0c;在分布式系统、高可用与高性能服务等领域有较丰富的经验。来源 | 腾讯技术博客当你在电商平台秒杀商品或者在社交网…

老司机带你学爬虫——Python爬虫技术分享

什么是“爬虫”&#xff1f; 简单来说&#xff0c;写一个从web上获取需要数据并按规定格式存储的程序就叫爬虫&#xff1b; 爬虫理论上步骤很简单&#xff0c;第一步获取html源码&#xff0c;第二步分析html并拿到数据。但实际操作&#xff0c;老麻烦了~ 用Python写“爬虫”有哪…

[转载]分享WCF聊天程序--WCFChat

http://www.cnblogs.com/gaoweipeng/archive/2009/09/04/1560260.html 无意中在一个国外的站点下到了一个利用WCF实现聊天的程序&#xff0c;作者是&#xff1a;Nikola Paljetak。研究了一下&#xff0c;自己做了测试和部分修改&#xff0c;感觉还不错&#xff0c;分享给大家。…

【C++】C++11 STL算法(五):设置操作(Set operations)、堆操作(Heap operations)

目录设置操作(Set operations)一、includes1、原型&#xff1a;2、说明&#xff1a;3、官方demo二、set_difference1、原型&#xff1a;2、说明&#xff1a;3、官方demo三、set_intersection1、原型&#xff1a;2、说明&#xff1a;3、官方demo四、set_symmetric_difference1、…