当今主流分割网络有哪些?12篇文章一次带你看完
作者 | 孙叔桥
来源 | 转载自有三AI(ID: yanyousan_ai)
本文的12篇文章总结了当前主流的分割网络及其结构,涵盖从编解码结构到解码器设计;从感受野到多尺度融合;从CNN到RNN与CRF;从2D分割到3D分割;从语义分割到实例分割和全景分割网络,感兴趣的朋友可以仔细研读每一篇文章。
1 FCN
Fully Convolutional Network(FCN)是神经网络用于图像分割任务的鼻祖,后续提出的大部分基于编解码结构的图像分割网络都是从FCN上发展、改进而来的。
FCN用卷积层替换了分类网络结构中的全连接层,从而得到稠密的分割结果,实现端到端训练。
同时,网络还将不同尺度下的特征信息进行融合,实现更细节的图像分割。

【图像分割模型】从FCN说起
2 SegNet
SegNet在FCN的基础上增加了解码器,形成目前分割任务中最流行的编解码结构,并给出了不同解码器对效果的影响和原因。
此外,由于应用了基于位置信息的加码过程,相比较FCN而言,SegNet中的对应结构的体量要小得多。

【图像分割模型】编解码结构SegNet
3 空洞卷积
编解码结构中,为了平衡空间尺寸与计算量,同时增大网络结构的感受野,通常会对输入图像进行一定的下采样。为了恢复分割结果的空间分辨率,解码器往往需要应用上采样或反卷积。
但是,基于插值的上采样效果通常不理想,而反卷积操作则增加了计算量。基于此,DeepLab中就提出了“空洞卷积”的概念,在不增加参数个数的基础上,实现感受野与分辨率的控制。

【分割模型解读】感受野与分辨率的控制术—空洞卷积
4 ENet
图像分割的任务最终还是要落脚于实际应用,而此前的网络结构最快也只能达到1fps,远不及实时所需要的10fps。
ENet基于空洞卷积,实现了NVIDIA TX1上分辨率480x320下的21.1fps。
此外,文中还介绍了设计实时网络结构所需要考虑的6个重要内容。

【图像分割模型】快速道路场景分割—ENet
5 CRFasRNN
在许多计算机视觉任务中,后处理操作能够有效提升算法的质量。而在众多后处理方法中,条件随机场(CRF)的效果名列前茅。
然而,CRF的理论性强,应用起来不方便。因此,CRFasRNN中提出以RNN的形式实现CRF的解决方案,从而让基于CRF的后处理变得简单。

【图像分割模型】以RNN形式做CRF后处理—CRFasRNN
6 PSPNet
不同感受野下所带来的上下文信息对图像分割而言十分重要,往往感受野选择的恰当性会直接影响最终的分割效果,这种影响对极端尺寸(极大和极小)目标表现地尤为明显。
为了在同一级别下融合多尺度下的上下文信息,PSPNet提出了池化金字塔结构,从而实现了可以理解目标所处环境的图像分割。

【图像分割模型】多感受野的金字塔结构—PSPNet
7 ParseNet
尽管从网络结构看,有些网络的理论感受野能够达到非常大,但实际上,理论感受野并不能等同于实际感受野,其覆盖和利用的信息也不够完整。
基于这个发现,ParseNet提出了基于池化的全局特征利用,从而实现全局特征与局部特征融合下的图像分割。
文中也介绍了如何有效融合两种特征,并利用好融合特征。

【图像分割模型】全局特征与局部特征的交响曲—ParseNet
8 RefineNet
尽管前面的特征融合方法能够恢复在计算过程中被下降的空间分辨率,但是这种恢复往往没有利用完整的原始空间信息,从而导致最终结果中的信息丢失。
基于此,RefineNet设计了空间分辨率的恢复结构,实现了基于残差卷积模块(RCU)、多分辨率融合模块(MRF)和串联残差池化模块(CRP)下的高精度图像分割。

【图像分割模型】多分辨率特征融合—RefineNet
9 ReSeg
尽管CNN的效果不错,但是其需要依赖人工指定的核函数实现计算,从而限制了上下文的处理能力。因此,ReSeg提出基于双向循环神经网络(BRNN)实现分割,来克服这种不足。
在ReNet的基础上,ReSeg通过依次扫描互相垂直的两个方向,实现不同时序下的特征提取。

【图像分割模型】用BRNN做分割—ReSeg
10 LSTM-CF
除了单纯基于2D的RGB图像的分割外,图像分割任务的完成还可以利用深度信息进行辅助,从而实现纹理信息下无法判断的分割。
LSTM-CF基于ReNet和空洞卷积,实现结合了深度信息的图像分割。为精度提升和深度信息利用提供了一种思路。

【图像分割模型】BRNN下的RGB-D分割—LSTM-CF
11 DeepMask
除了语义分割,图像分割中还有另外两种类别的任务:实例分割和全景分割。
我们通过DeepMask,给出了实例分割下的网络的设计思路。DeepMask可以同时实现前背景分割、前景语义分割和前景实例分割。

【图像分割模型】实例分割模型—DeepMask
12 全景分割
语义分割与实例分割任务虽然相似,但是由于度量不同,二者无法直接结合。为了实现整图内things类别和stuff类别的同时分割,全景分割任务提出了新的度量。
全景分割任务下,图像内的每个像素点都有其对应的语义标签和实例标签(things类别),从而能够最大程度上地理解整幅图像。

【图像分割模型】全景分割是什么?
(*本文为 AI科技大本营转载文章,转载请联系原作者)
◆
精彩推荐
◆
参与投稿加入作者群,成为全宇宙最优秀的技术人~
大会开幕倒计时5天!
2019以太坊技术及应用大会特邀以太坊创始人V神与众多海内外知名技术专家齐聚北京,聚焦区块链技术,把握时代机遇,深耕行业应用,共话以太坊2.0新生态。即刻扫码,享优惠票价。
推荐阅读
6月技术福利限时免费领
2019年技术盘点容器篇(一):听UCloud谈风生水起的K8S | 程序员硬核评测
异类框架BigDL,TensorFlow的潜在杀器!
吐血总结!100个Python面试问题集锦(上)
5G 时代,微软又走对了一步棋!
LinkedIn最新报告: 区块链成职位需求增长最快领域, 这些地区对区块链人才渴求度最高……
写代码不严谨,我就不配当程序员?
碾压Bert?“屠榜”的XLnet对NLP任务意味着什么
如何向妹子解释:为啥 5G 来了需要换 SIM卡!

相关文章:

正确生成浮点型的方法,解决sqlachemy Float浮点型的坑,生成float类型时,长度和精度均为0,导致查询不到结果!...
问题描述 在使用flask_sqlachemy时,给price字段选择了Float类型,数据库用的mysql,生成数据库表后,发现 from sqlalchemy import Float,Column price Column(Float,default0.00) 虽然能存储float类型,结果如下 但是查询…

图像轮廓的提取和绘制
转自:http://blog.csdn.net/gnuhpc/archive/2009/06/18/4278105.aspx <>var ultimaFecha ; <>document.write(ultimaFecha); #include "highgui.h" #include "cv.h" #include <iostream> #include <iomanip> using …

上海交大张拳石:神经网络的可解释性,从经验主义到数学建模
作者 | 张拳石来源 | 转载自知乎Qs.Zhang张拳石本来想把题目取为“从炼丹到化学”,但是这样的题目太言过其实,远不是近期可以做到的,学术研究需要严谨。但是,寻找适当的数学工具去建模深度神经网络表达能力和训练能力,…
计算机网络模型到底是七层?五层?四层?
1.Introduction 本篇文章的初衷是在做Android网络开发时经常接触各种协议,比如HTTP、XMPP、HLS、RTSP、TCP等协议,对网络的模型和层次有个直观的了解可以做到心中有数。OSI参考模型是七层,TCP/IP模型是四层,计算机网络(…

【推荐】使用Ultrapico Expresso学习正则表达式
推荐理由Ultrapico Expresso是我工作中经常使用的一个非常强大的正则表达式构建、测试以及代码生成工具。它能够对你构建的正则表达式进行解析、验证,并输出解析结果,提供性能测试工具,支持C#、VB等代码生成,最重要的是࿰…

OpenCV中常用到的轮廓处理函数汇总
转自:http://fsa.ia.ac.cn/opencv-doc-cn/opencv-doc-cn-0.9.7/ref/opencvref_cv.cn.htm ApproxChains 用多边形曲线逼近 Freeman 链 CvSeq* cvApproxChains( CvSeq* src_seq, CvMemStorage* storage,int methodCV_CHAIN_APPROX_SIMPLE,double parameter0, int mi…

《Linux内核原理与分析》第二周作业
反汇编一个简单的C程序 1、实验要求 使用: gcc –S –o test.s test.c -m32 命令编译成汇编代码,对汇编代码进行分析总结。其中test.c的具体内容如下: int g(int x) {return x 3; }int f(int x) {return g(x); }int main(void) {return f(8)…

首次!腾讯全面公开整体开源路线图
6月25日,由Cloud Native Computing Foundation (CNCF) 主办的云原生技术大会在上海举办,腾讯开源联盟主席、腾讯开源管理办公室委员、Apache Member堵俊平首次公开了腾讯整体的开源战略路线图。 堵俊平表示:“腾讯开源提倡‘开放、共享、合力…

201771010111李瑞红《面向对象的程序设计》第八周实验总结
实验八接口的定义与使用 实验时间 2018-10 理论部分 6.1 接口:用interface声明,是抽象方法和常量值定义的集 合。从本质上讲,接口是一种特殊的抽象类。 在Java程序设计语言中,接口不是类,而是对类 的一组需求描述,由常…

崛起的Python,真的影响了76万人?
随着AI的兴起,Python彻底火了。据Stack Overflow调研报告:Python的月活用户已超越了Java、成为第一,全民Python已为“大势所趋”。那么,程序员有必要学Python吗?如何高效掌握Python?程序员为啥要学Python&a…

OpenCV查找轮廓
转自:http://westice.javaeye.com/blog/721225 主要函数是 cvFindContours(tour_buf,storage,&contour,sizeof(CvContour), CV_RETR_EXTERNAL, CV_CHAIN_APPROX_SIMPLE); tour_buf 是需要查找轮廓…

非阻塞socket的连接
引用自:http://blog.csdn.net/cccallen/article/details/6619994 连接套接字,阻塞的套接字超时时间很长无法接受,而是用非阻塞套接字时使用的方案也有多种。后者是个比较好的方法 方案1:不断重试,直到连接上或者超时&a…

OpenCV下车牌定位算法实现代码
转自:http://blog.csdn.net/heihei723/archive/2006/05/14/728046.aspx#FeedBack 车牌定位算法在车牌识别技术中占有很重要地位,一个车牌识别系统的识别率往往取决于车牌定位的成功率及准确度。 车牌定位有很多种算法,从最简单的来࿰…

2018-2019-1 20165310 20165315 20165226 实验一 开发环境的熟悉
2018-2019-1 20165226 20165310 20165315 实验一 开发环境的熟悉 目录 一、实验目的 二、实验步骤 三、实验过程中遇到的问题及解决 四、实验感想 一、实验目的 熟悉Linux开发环境并学会Linux开发环境的配置和使用,熟悉arm箱的使用,熟悉以下知识点&#…

上海居民被垃圾分类逼疯!这款垃圾自动分类器也许能帮上忙
作者 | 视说君来源 | 授权转载自视说AI(ID:techtalkai)让垃圾自动分类近期垃圾分类成为了一个热门话题,原来直接一次性扔掉的垃圾,现在都需要分门别类进行投放。从今年7月1日起,新的《上海市生活垃圾管理条例》正式开始…

虽被BERT碾压,但还是有必要谈谈BERT时代与后时代的NLP
作者 | 吴金龙,爱因互动技术合伙人,算法负责人来源 | 授权转载自AINLP(ID:nlpjob)2018年是NLP的收获大年,模型预训练技术终于被批量成功应用于多项NLP任务。之前搞NLP的人一直羡慕搞CV的人,在ImageNet上训练…

C++ 简单读写文本文件、统计文件的行数、读取文件数据到数组
转自:http://hi.baidu.com/ctralt/blog/item/cde79fec87f841302697911c.html fstream提供了三个类,用来实现c对文件的操作。(文件的创建、读、写)。ifstream -- 从已有的文件读 ofstream -- 向文件写内容 fstream - 打开文件供读写…

Exchange 2007迁移2010时的公用文件夹多个公用树错误
近期在项目中,客户Exchange 从2007迁移到2010,Microsoft Exchange从2007开始就逐渐弱化了公用文件夹,outlook 2007和2010都不需要使用到公用文件夹了。但客户现状存在90%的outlook 2003客户端,因此需要使用到公用文件夹。在Exchan…

约瑟夫环问题的两种解法(详解)
约瑟夫环问题的两种解法(详解) 题目: Josephus有过的故事:39 个犹太人与Josephus及他的朋友躲到一个洞中,39个犹太人决定宁愿死也不要被敌人抓。于是决定了自杀方式,41个人排成一个圆圈,由第1个…

Linux下多播的配置【十全十美】
单播地址标识单个IP接口,广播地址标识某个子网的所有IP接口。多播地址表示某一组IP接口,单播和广播是寻址方案中的两个极端(要么单个要么全部),多播则意在两者之间提供一种折中方案。多播是用于建立分布式系统的重要工具,例如&…

CvSeq相关函数
转自:http://hi.baidu.com/pengjun/blog/item/a72fc8ea030e79d4d439c906.html 函数原型说明CvSeq* cvCreateSeq(int seq_flags,int header_size,int elem_size,CvMemStorage* storage)功能:创建一序列 参数:seq_flags为序列的符号标志。如果序…

10月份机房技术指标
下载syslinux,dhcp,http,tftp-serveryum -y install syslinux dhcp httpd tftp-serveryum -y install system-config-kickstart挂载sr0是镜像用system-config-kickstart工具来生成一个自动的安装的配置文件ip填自己的ip地址。目录填挂载光盘的…

5G时代,微软又走对了一步棋!
2019年4月,CSDN采访微软(中国)首席技术官韦青,期间谈到5G。他认为,5G绝对是一个划时代的革命性突破,但是这个突破不止于现在所说的“5G”通讯技术,它为未来以“万物互联”为基础的智能社会开创了…

6426C Lab3 部署证书和管理注册
共有4个练习:练习1:配置证书模板练习2:配置自动注册练习3:管理证书 Revocation练习4:配置Key Recovery练习1:任务1:复制、安装和手动注册一个证书1. 转到HQDC1.contoso.com服务器,添…

CreateStructuringElementEx
转自:http://baike.baidu.com/view/4819443.htm CreateStructuringElementEx 创建结构元素 IplConvKernel* cvCreateStructuringElementEx( int cols, int rows, int anchor_x, int anchor_y, int shape, int* valuesNULL ); cols 结构元素的列数目 rows 结构…

阿里AI再摘一冠,大幅提高视觉对话世界纪录
近日, 在第二届视觉对话挑战赛Visual Dialogue Challenge中,阿里AI击败了微软、首尔大学等十支参赛队伍,获得冠军。 (阿里AI在视觉对话竞赛中得冠)视觉对话竞赛由美国佐治亚理工大学、Facebook人工智能实验室ÿ…

OSChina 周一乱弹 —— 嫂子我帮你们照顾放心吧
2019独角兽企业重金招聘Python工程师标准>>> Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 clouddyy :#每日一歌# 《绿光 - 孙燕姿》 《绿光》 - 孙燕姿 手机党少年们想听歌,请使劲儿戳࿰…

十一月工作小记--上线前的冲刺
加班不是目的,重要的是找到加班的意义。尽管程序猿们有很多个不愿意,他们却依然要面对加班的现实。加班就是程序猿们生活中的一张牌,既然不能决定这张牌是什么,那就想想如何去打好这张牌吧。本月,我们的生活依然是那么…

Java跌落神坛,Python继续夺冠....凭啥?
编程语言流行指数(PYPL)排行榜近日公布了2019年6月份榜单。相比 5 月编程语言榜单,Python 不仅超过了 C,成功占据第三名位置,还以 2.77% 的涨幅成为增速最快的编程语言,与此同时,拥有 8.53% 份额的 Python 达到了 TIOB…

opencv实现二值图像细化的算法
转自:http://blog.csdn.net/byxdaz/archive/2010/06/02/5642669.aspx 细化算法通常和骨骼化、骨架化算法是相同的意思,也就是thin算法或者skeleton算法。虽然很多图像处理的教材上不是这么写的,具体原因可以看这篇论文,Louisa Lam…