当前位置: 首页 > 编程日记 > 正文

<论文阅读>CascadePSP: Toward Class-Agnostic and Very High-Resolution Segmentation via Global and...

名词解释:
双三次插值:双三次插值是一种更加复杂的插值方式,它能创造出比双线性插值更平滑的图像边缘。

**标题翻译:**通过全局和局部优化进行面向不可知类和超高像素图像的分割
CascadePSP: Toward Class-Agnostic and Very High-Resolution Segmentation via Global and Local Refinement

改论文提出的高像素图片解决方法能够不使用任何高像素训练数据。

使用我们的模型可以揭示像素精准的分割界限而不用任何微调->不可知类

**引言:**许多计算机视觉SOTA算法面临高像素挑战

对于高像素的图片需要特别大的接收域来捕获充分的语义信息
合理的解决方法有降采样和修剪,但前者移掉了细节,后者毁掉了图像内容

CascadePSP是一个通用的分割提取模型,能够提取任何给定的分割,从超低到超高像素。这个模型能加到任何已经存在的模型来提升其分割,一个更好、更精确的分割掩码将被提供。我们的模型将初始掩码作为输入,该掩码可以是提供粗略对象位置的任何算法的输出。然后我们的模型会输出一张改进的掩码。
CascadePSP是一种级联风格的模型,以一种由粗到细的方式生成改进的分割。

从这幅图可以看出,CascadePSP不仅高像素的输出分割,而且提升和纠正了原先错误的边缘,产生了更准确的结果。

在这里插入图片描述

**模型介绍部分:**细化模型and级联方法
1.细化模型
在这里插入图片描述
如图所示,CascadePSP将一张图像和多个不完美的分割mask作为输入,输出一个改进的分割结果。多规模的输入允许模型得到不同级别的结构和边缘信息,这为网络学习自动地融合掩码特征来最好地改进分割结果提供基础。

所有低像素的输入分割都被双线性地升采样到相同的规模,并于RGB图像相连。我们使用PSPNet与ResNet-50作为骨干网,获取步长为8的特征图谱作为输入。我们采用[1,2,3,6]的金字塔池化大小来获得全局的内容。除了最后一张步长为1的输出,CascadePSP还会输出中间的步长为8和4的分割结果,聚焦于修复输入模型的全局结构。我们跳过步长2来为纠正局部的错误边界提供灵活性。

为了重建提取过程中丢失的像素级图片细节,我们采取了从主干网跳过连接以及使用一个上采样块融合特征的方式。我们连接来自主干网的跳过联络的特征与双线性上采样特征,用两个ResNet块处理它们。一个分割结果的输出是用了一个2层的1x1卷积加一个sigmoid激活。

2.全局的和局部的CascadePSP改进
在测试中,我们分别采用全局和局部的步长,用相同的训练过的优化模型来执行高像素分割。
具体来说,全局的步长考虑到了完整的调整过大小后的图像来修复结构,而局部的步长使用图像修建来提升全部像素的细节。
相同的图像模型能够被递归地用于高像素优化。
2.1全局步长
在这里插入图片描述
上图表示的是全局步长的细节,用一个3级cascade来改善整个图像。全像素图片在测试过程中往往不能被GPU处理,我们对输入进行降采样以便于长轴位有着长度L的同时保持相同的长宽比。

我们将cascade的输入初始化为输入分割,这个过程直接复制来保证输入输入通道维度保持不变。经过第一级的cascade之后,输入通道之一会被双线性上采样的输出取代。这个过程将一直重复到最后一级,最后一级的输入由初始分割和之前所有层级的输出构成。

这种设计使得我们的网络能够逐步修复分割错误,在保持细节的前提之下呈现出原始的分割。有了多层级,我们能够粗糙地描绘物体的轮廓、修正大的错误,并利用粗糙层级提供的更具健壮性的特征聚焦精细层级的边界精确度。

2.2局部步长
在这里插入图片描述
上图描绘了局部步长的细节。超高像素的图片即使在现代的GPU上也由于内存的限制不能够被一次性处理。此外,训练和测试数据规模的剧烈改变也会造成不好的分割质量。我们用我们的cascade模型首先用一个降采样的图片执行了全局的优化,然后使用一个从更高像素的图片上修建下的图片来执行局部的优化。这些修剪使得本地步长在没有高像素训练数据的情况下处理高像素的图片,与此同时吸收进全局步长得到的图像内容。

在局部步长中,模型将全局步长的最后一级的两个输出表示为S_11和S_41。两张输出都被双线性地调整为原始图像的大小。该模型采用尺寸为L×L的图像裁切,并且从裁切输出的每一侧切开16个像素,以避免出现边界伪像(图像边界处除外)。均匀地以L / 2-32的步幅拍摄作物,以使大多数像素被四个作物覆盖,并且超出图像边界的无效作物将移动以与图像的最后一行/列对齐。然后将图像作物送入2级的级联中,输出步幅分别为4和1。融合时,由于图像上下文不同,不同补丁的输出可能会彼此不一致,我们通过对所有输出值求平均值来解决此问题。对于分辨率更高的图像,我们以从粗到精的方式递归地应用局部步长。

相关文章:

【转】MYSQL入门学习之十:视图的基本操作

转载地址:http://www.2cto.com/database/201212/176775.html 一、视图的基本介绍 www.2cto.com 视图是虚拟的表。与包含数据的表不一样,视图只包含使用时动态检索数据的查询。使用视图需要MySQL5及以后的版本支持。下面是视图的一些常见应用&#xff1…

自动化运维之SaltStack,批量安装httpd实战

SaltStack原理 SaltStack由Master和Minion构成,Master 是服务端, 表示一台服务器;Minion是客户服务端,表示多台服务器。在Master上发送命令给符合条件的Minion,Minin就会执行相应的命令,Master和Minion之间是通过ZeroM…

我的面试(四)补充1

突然想起来前天面试时,考官问我out参数和ref参数的区别。我当时答的是out是出的,ref可以来回传参。也就是说out参数是进不来的,而ref是可以进来了。今天写代码试了试。从新整理一下关于out和ref的区别。static void Function1(out int outPar…

(C++)输入10个整数,将其中最小的数与第一个数对换,把最大的数与最后一个数对换。要求用3个函数实现,分别为输入10个数、进行处理、输出10个数。要求使用指针的方法进行处理。

#include<cstdio> //输入10个整数&#xff0c;将其中最小的数与第一个数对换&#xff0c;把最大的数与最后一个数对换。要求用3个函数实现&#xff0c;分别为输入10个数、进行处理、输出10个数。要求使用指针的方法进行处理。 //编写函数——输入10个数 //编写函数——进…

深入biztalk消息以及消息订阅发布路由机制(二)-消息订阅【转】

一.消息订阅 订阅消息的主体叫订阅服务器&#xff0c;订阅服务器是可以订阅并消费消息的服务&#xff0c;可以作为订阅服务器的服务类型目前有四类&#xff0c;在BizTalkMgmtDb管理数据库中的adm_ServiceClass的Name字段列出了所有可以作为订阅服务器的服务类型&#xff0c;包括…

poj1625Censored!(AC自动机+dp)

链接 第一次做这种题目&#xff0c;参考了下题解&#xff0c;相当于把树扯直了做DP&#xff0c;估计这一类题都是这个套路吧。 状态方程dp[i][next] dp[i][next]dp[i][j] ;dp[i][j]表示长度为i的第J个结点的时候满足题意的num&#xff0c;next为当前j点所能走到的下一个合法的…

图解5G NR帧结构

子载波间隔 与LTE&#xff08;子载波间隔和符号长度&#xff09;相比&#xff0c; NR支持多种子载波间隔&#xff08;在LTE中&#xff0c;只有15 Khz这种子载波间隔&#xff09;。 在3GPP38.211中&#xff0c;有关于NR子载波间隔类型的总结。 具体的子载波间隔类型如下图所示&a…

(C++) A+B 输入输出练习IV 每行的第一个数N,表示本行后面有N个数。 如果N=0时,表示输入结束,且这一行不要计算。

#include<cstdio>/* 4 1 2 3 4 5 1 2 3 4 5 0 */int main(){int n,a;while(scanf("%d",&n),n){int sum 0;for(int i 0;i<n;i){scanf("%d",&a);sum a;}printf("%d\n",sum); }return 0;}

jQuery与其它库冲突的解决方法(转)

原文出处&#xff1a;http://www.jb51.net/article/24014.htm 在jQuery库中&#xff0c;几乎所有的插件都被限制在它的命名空间里。全局的对象都很好地存储在jQuery命名空间里&#xff0c;因此当把jQuery和其它javascript类库一起使用时&#xff0c;不会引起冲突. (注意&#x…

ASP.NET 下载文件方式

protected void Button1_Click(object sender, EventArgs e){/*微软为Response对象提供了一个新的方法TransmitFile来解决使用Response.BinaryWrite下载超过400mb的文件时导致Aspnet_wp.exe进程回收而无法成功下载的问题。代码如下&#xff1a;*/Response.ContentType "a…

ITIL管理思想的执行工具发布

E8.HelpDesk是融入ITIL管理思想&#xff0c;并结合中国企业实施ITIL的实际需求&#xff0c;成功研发ITIL管理思想的执行工具&#xff0c;全面帮助中国企业高效导入ITIL管理体系&#xff0c;提升企业战略执行力。 E8.HelpDesk支持多种服务台管理体系&#xff0c;支持事件管理、问…

(C++)A+B 输入输出练习V 输入的第一行是一个正数N,表示后面有N行。每一行的第一个数是M,表示本行后面还有M个数。

#include<cstdio>/* 2 4 1 2 3 4 5 1 2 3 4 5 */int main(){int n,a;scanf("%d",&n);while(n--){int sum 0,m;scanf("%d",&m);for(int i 0;i<m;i){scanf("%d",&a);sum a;}printf("%d\n",sum); }return 0;}

Linux上重启服务的正确命令

在开发环境下&#xff0c;我们经常需要部署代码&#xff0c;重启服务&#xff0c;所以会把命令写在脚本中&#xff0c;方便使用。 我们可能这么写 #!/bin/bashps -ef | grep backend-api-1.0 | grep -v "\-\-color" |awk {print $2} |xargs kill -9 sleep 1 nohup ja…

Error: Most middleware (like bodyParser) ...

运行NodeJS时出现如下错误&#xff1a; Error: Most middleware (like bodyParser) is no longer bundled with Express and must be installed separately. 意思是 命令行中运行 npm install body-parser 回车&#xff0c;进行安装。 对源代码进行调整&#xff0c;加上 var b…

[导入][转]常用CSS缩写语法总结

使用缩写可以帮助减少你CSS文件的大小&#xff0c;更加容易阅读。css缩写的主要规则如下&#xff1a; 颜色 16进制的色彩值&#xff0c;如果每两位的值相同&#xff0c;可以缩写一半&#xff0c;例如&#xff1a; #000000可以缩写为#000;#336699可以缩写为#369; 盒尺寸 通常有下…

(C++)A+B 输入输出练习VI 每行的第一个数N,表示本行后面有N个数。

#include<cstdio>/* 4 1 2 3 4 5 1 2 3 4 5 */int main(){int n;while(scanf("%d",&n) ! EOF){int sum 0,a;for(int i 0;i<n;i){scanf("%d",&a);sum a;}printf("%d\n",sum); }return 0;}

NDK 提示undefined reference to xxx“的解决办法

在Android.mk文件的 LOCAL_SRC_FILES后面加入包含该类或函数的文件&#xff0c;用\隔开&#xff0c;\后换行继续添加 例如 LOCAL_SRC_FILES : NDKTest.cpp\bncore.c\bn_error.c\bn_fast_mp_invmod.c\bn_fast_mp_montgomery_reduce.c\bn_fast_s_mp_mul_digs.c\bn_fast_s_mp_mul_…

7. Query Expressions(查询表达式)

【返回目录】 查询表达式提供了与SQL这样的关系化和分级的查询语言相类似的语言集成的语法。一个查询表达式是以from子句开头以select或者group子句结束&#xff0c;这个初始的from子句可以在其后跟随任意多个from、let、where或者join子句。 那么查询表达式中的这些子句都是做…

CSS完美兼容IE6/IE7/IE8/IE9/IE10的通用方法

300px!important;width /**/:340px;margin:0 10px 0 10px} &#xff0c;关于这个/**/是什么我也不太明白&#xff0c;只知道IE5和firefox都支持但IE6不支持&#xff0c;如果有人理解的话&#xff0c;请告诉我一声&#xff0c;谢了&#xff01;&#xff1a;&#xff09; 3、ul标…

(C++)A+B 输入输出练习VII 输入包含若干行,每行输入两个整数a和b,由空格分隔。 对于每组输入,输出a和b的和,每行输出后接一个空行。

#include<stdio.h> /* 1 5 10 20 */int main() { int a,b;while(scanf("%d%d",&a,&b) ! EOF){printf("%d\n\n",ab);}return 0;}

Address already in use: JVM_Bind错误的解决

错误原因 tomcat的8005端口号被占用了 解决办法 关闭已有的占用端口 1. cmd—>netstat -an 查看当前开启的端口号 2. netstat -ano 获得端口号的pid码 3. skill -{pid} 杀死端口进程转载于:https://www.cnblogs.com/lxq0309/p/3736899.html

在SQL Server中如何转化长日期形式为短日期格式

convert(nvarchar(10),字段名,121)即可将时间格式转化为yyyy-mm-dd格式 convert中的121是指将datetime类型转换为char类型时获得包括世纪位数的4位年份。转载于:https://www.cnblogs.com/footleg/archive/2007/11/29/976451.html

看看Vector源码Java 9

2019独角兽企业重金招聘Python工程师标准>>> Vector类实现了一个可增长的对象数组。像数组一样&#xff0c;它包含可以使用整数索引随机访问。但是&#xff0c;Vector的大小可以根据需要增大或缩小&#xff0c;以适应在创建Vector之后添加和删除项目。 文档里的内容…

(C++)1016 部分A+B 正整数

#include<cstdio>int main(){ //1.读入a,Da,b,Dblong long a,b,Pa0,Pb0;int Da,Db;scanf("%lld%d%lld%d",&a,&Da,&b,&Db); //2.对于a,遍历每一位&#xff0c;加在Pa上 //2.1取余的方式遍历while(a>0){if(a%10Da){Pa Pa*10 Da;}a a/10;} …

MySQL Innodb日志机制深入分析

1.1. Log & Checkpoint Innodb的事务日志是指Redo log&#xff0c;简称Log,保存在日志文件ib_logfile*里面。Innodb还有另外一个日志Undo log&#xff0c;但Undo log是存放在共享表空间里面的&#xff08;ibdata*文件&#xff09;。 由于Log和Checkpoint紧密相关&#xff0…

单元测试的重要性

一些错误的认识 在实际的单元测试过程中总会有一些错误的认识左右着我们&#xff0c;使之成为单元测试最大的障碍&#xff0c;在此将其一一分析如下&#xff1a; 它太浪费时间了&#xff0c;现在要赶进度&#xff0c;时间上根本不允许&#xff0c;或者随便做做应付领导。 我是一…

浅谈网络协议(四) IP的由来--DHCP与PXE

2019独角兽企业重金招聘Python工程师标准>>> 上一节说过&#xff0c;IP就是一台计算机的通讯地址&#xff0c;要和其他机器通讯&#xff0c;就需要一个通讯地址&#xff0c;就要给网卡配置这么一个地址。 配置 IP 那如何配置呢&#xff1f;可以使用 ifconfig&#x…

(C++)1026 程序运行时间

#include<cstdio> const int CLK_TCK100;int main(){ //1.读入c1,c2int c1,c2;scanf("%d%d",&c1,&c2); //2.定义常量CLK_TCK100 //难点&#xff1a;不足 1 秒的时间四舍五入到秒 --不用round()&#xff0c;避免浮点数运算 int dif c2-c1;if(dif%100&…

Spring中@Autowired注解、@Resource注解的区别

Spring不但支持自己定义的Autowired注解&#xff0c;还支持几个由JSR-250规范定义的注解&#xff0c;它们分别是Resource、PostConstruct以及PreDestroy。  Resource的作用相当于Autowired&#xff0c;只不过Autowired按byType自动注入&#xff0c;而Resource默认按 byName自…

(C++)1046 划拳

划拳是古老中国酒文化的一个有趣的组成部分。酒桌上两人划拳的方法为&#xff1a;每人口中喊出一个数字&#xff0c;同时用手比划出一个数字。如果谁比划出的数字正好等于两人喊出的数字之和&#xff0c;谁就赢了&#xff0c;输家罚一杯酒。两人同赢或两人同输则继续下一轮&…