当前位置: 首页 > 编程日记 > 正文

小米开源FALSR算法:快速精确轻量级的超分辨率模型

640?wx_fmt=jpeg


作者 | 周强(我爱计算机视觉)、刘畅

编辑 | Jane

出品 | AI科技大本营


这是来自小米最新出炉的论文,使用神经架构搜索技术自动确定超分辨率网络模型,取得了又快又好的效果,模型已开源,非常赞!


640?wx_fmt=png


摘要


深度卷积神经网络用于超分辨率任务中取得了长足的进步。 之前的一系列研究集中于通过使用更深层的网络来改善评价指标峰值信噪比(PSNR),而更多层往往意味着需要更多计算资料,这在计算资源有限的终端上并不容易应用。


为了设计能够在边缘设备步骤的超分辨率系统,需要在重建性能和模型的简单性之间进行权衡,但这本身并不容易把握。 学界最近的一些研究工作正在努力人工实现平衡,而本文的工作则是通过神经架构搜索自动实现相同的目标。


具体来说,本文采用多目标方法(反应模型性能的度量 PSNR,反应模型计算量的 mult-adds,和模型参数量)处理超分辨率。 还提出了一种基于混合控制器的微观和宏观层面的弹性搜索策略,该控制器利用进化计算和强化学习方法提升模型性能。


实验证明本文方法自动设计的模型在计算量可比较的模型中达到了最先进方法。


640?wx_fmt=png

SR的神经架构


640?wx_fmt=png

与state-of-the-art方法的精度比较


640?wx_fmt=png

在计算量可比较的模型中,该文提出的方法精度更高


论文地址:

https://arxiv.org/pdf/1901.07261v2.pdf


代码地址:

https://github.com/falsr/FALSR

可惜的是,官方并没有公开训练代码。


最近,神经架构搜索研究和应用的论文越来越多,这是要替换掉算法工程师的节奏,更有人断言将来各种任务中最好的模型一定来自机器设计的模型!小米的这篇论文,在图像超分辨工程应用领域机器已经把算法工程师比下去了!


更多学习


什么是图像的超分辨重构技术(Super-Resolution)


图像的超分辨重构技术是指从一张或多张低分辨率的图像中,重构出相应的高分辨率图像。主要分为两类,一是从单张低分辨率图像中重建出高分辨率图像。二是从多张低分辨率图像中重建出高分辨率图像。基于深度学习的SR,主要是基于单张图像的重构方法。其应用领域非常广泛,涉及军事、医学、地理等。



超分辨重构和去噪、去网格、去模糊等问题是类似的。对于一张低分辨图像,可能会有多张高分辨图像与之对应,因此通常在求解高分辨率图像时会加一个先验信息进行规范化约束。在传统的方法中,通常会先学习这个先验信息。而基于深度学习的SR方法,则是通过神经网络直接进行从低分辨图像到高分辨图像的端到端的学习。


主要论文


  • Image Super-Resolution Using Deep Convolutional Networks


SRCNN(PAMI 2016)

http://mmlab.ie.cuhk.edu.hk/projects/SRCNN.html


  • 《Accurate Image Super-Resolution Using Very Deep Convolutional Networks》


VDSR(CVPR 2016)

https://github.com/huangzehao/caffe-vdsr


  • 《Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution》


LapSRN(CVPR 2017)

https://github.com/phoenix104104/LapSRN


  • 《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial》


SRGAN(CVPR oral 2017)

https://github.com/buriburisuri/SRGAN


  • 《Enhanced Deep Residual Networks for Single Image Super-Resolution》


EDSR(CVPR Workshop 2017)

https://github.com/thstkdgus35/EDSR-PyTorch


  • 《Residual Dense Network for Image Super-Resolution》


RDN(CVPR 2018)

https://github.com/yulunzhang/RDN


  • 《Image Super-Resolution Using Very Deep Residual Channel Attention Networks》


RCAN(ECCV 2018)

https://github.com/yulunzhang/RCAN


  • 《ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks》


ESRGAN(ECCV Workshop 2018)

https://github.com/xinntao/ESRGAN


更多解读可参考:

https://blog.csdn.net/u012395979/article/details/85854893


(本文为 AI科技大本营整理文章,转载请微信联系 1092722531。 

推荐

640?wx_fmt=png

推荐阅读

  • iPhone曝严重漏洞,用户接听FaceTime前或被“监听”!

  • 熬夜写代码,不如换女装入GitHub获上千Star?

  • “百练”成钢:NumPy 100练

  • 小学生手写Python程序解魔方!这是高手,这绝对是高手!

  • 鏖战九载,Google 是否会因 Oracle 而弃用 Java?

  • 小心!你的脸正在成为色情片主角

  • 聊聊云计算:为什么构建网站时常会用到负载均衡

  • 年度大戏!以太坊大神怒怼智能合约之父,尼克·萨博到底做错了啥?

  • 嫁人当嫁程序员

640?wx_fmt=png


相关文章:

Node.js服务器启用Gzip压缩

Gzip是什么 复制大神们的解释吧: GZIP最早由Jean-loup Gailly和Mark Adler创建,用于UNIX系统的文件压缩。我们在Linux中经常会用到后缀为.gz的文件,它们就是GZIP格式的。现今已经成为Internet 上使用非常普遍的一种数据压缩格式,或…

【bzoj1251】序列终结者(伸展树)

【bzoj1251】序列终结者(伸展树) Description 网上有许多题,就是给定一个序列,要你支持几种操作:A、B、C、D。一看另一道题,又是一个序列 要支持几种操作:D、C、B、A。尤其是我们这里的某人&…

再谈PowerPoint 2010导出幻灯片为图片

前些日子写了篇《利用VBA导出幻灯片为图片》,结果被Jackson告知,PowerPoint 2010已经有此功能了,并且PowerPoint 2007可能就已经有了。并且经最终验证,在PowerPoint 2003中同样有此功能。由于平时用PowerPoint并不多,所…

【网络编程】非阻塞connect详解

一、为什么使用非阻塞connect TCP连接的建立涉及一个在三路握手过程,阻塞的connect一直等到客户收到自己的SYN的ACK才返回,这需要至少一个RTT时间,RTT时间波动很大从几毫秒到几秒。而且在没有响应时,会等待数秒再次发送&#xff0…

AI,被“横扫记录”反噬?

编辑 | Jane 出品 | AI科技大本营 昨天,香侬科技发表论文《Glyce: Glyph-vectors for Chinese Character Representations》,提出基于中文字形的 NLP 模型——Glyce。香侬科技官方公开的论文解读中写道: Glyce提出了基于中文字形的语义表示&…

android 入门之一【开发环境搭建】

这里的开发环境采用Eclipseandroid 开发插件,其它的开发环境不做介绍 一.安装JDK android 开发语言是基于Java的,所以要做android的开发必须要安装JDK,并且对JDK的版本有一定的要求必须是JDK5 以上的版本,JDK5以前的版本android不…

一块GPU就能训练语义分割网络,百度PaddlePaddle是如何优化的?

【引言】显存不足是训练语义分割网络常常遇见的问题,而显存是GPU计算中的稀缺资源。百度深度学习框架PaddlePaddle中的显存优化,不仅可以让研究人员在相同成本的计算设备上训练更大的模型,还可以在消费级别显卡上完成训练。在本篇文章中&…

【音频】Faad源码交叉编译

1、源码下载http://www.audiocoding.com/downloads.html2、解压后,进入目录执行如下命令aclocalautoheaderautomake --add-missingautoconf./configure --hostarm-fsl-linux-gnueabi CCarm-fsl-linux-gnueabi-gcc --prefix/home/faad/installmakemake install

springboot 整合redis 实现KeySpaceNotification 键空间通知

2019独角兽企业重金招聘Python工程师标准>>> 目录结构如下: application.properties配置文件(redis的配置): spring.redis.hostlocalhost spring.redis.pool.max-idle300 spring.redis.pool.max-wait3000 spring.redis…

黄聪:穿过主机访问虚拟机中的SQL服务 FOR VMware NAT

一般来说,大家都会在主机或者虚拟机中安装SQLIIS,但假如主机的IIS想利用虚拟机中的SQL服务怎么办呢? 以我的电脑为例子,主机系统:Windows 7 7600 RTM X64,安装IIS 7.5。虚拟机系统:Windows 2003…

【数据库】mysql报错 编码码1130 和错误码1146

1、错误编码1130 问题:1130-Hose‘172.16.12.129’is not allowed to connect to this MySQL server 原因:MySQL服务器没有创建,远程客户的账户信息 解决: 1.1 登录 :mysql -uroot 1.2 切换数据库:mysql>…

一键fxxk,代码修复神器拯救你

作者 | 一一出品 | AI科技大本营(ID:rgznai100)在成为一个合格的开发者之前,大多数人一般都经历过被命令行反复“fuck”蹂躏。当然,改代码改不动了,你的内心也是“无 fuck 可说”,尤其在检查半天之后发现这…

hive2.3.2安装使用

hive的安装简单一些,使用也比较简单,基础hadoop搭建好之后,只要初始化一些目录和数据库就好了 安装需要做几件事: 1.设立一个数据源作为元数据存储的地方,默认是derby内嵌数据库,不过不允许远程连接,所以换成mysql 2.配置java路径和classpath路径 下载地址: http://mirrors.shu…

Google经典面试题解析

作者 | Alex Golec译者 | 弯月责编 | 屠敏出品 | CSDN(ID:CSDNnews)在深入问题之前,有一个令人振奋的消息:我离开了Google!我激动地宣布,我已经加入了Reddit,并在纽约市担任项目经理…

1分钟构建API网关日志解决方案

访问日志(Acccess Log)是由web服务生成的日志,每一次api请求都对应一条访问记录,内容包括调用者IP、请求的URL、响应延迟、返回状态码、请求和响应字节数等重要信息。 阿里云API网关提供API托管服务,在微服务聚合、前后…

ISQL*PLUS

1、有以下几种命令:环境:影响会话期间SQL语句的总体行为;格式化:格式化查询结果;文件处理:保存语句到脚本文件中,从脚本文件中运行语句;执行:从浏览器发送SQL语句到oracl…

【数据库】mysql 常用命令(一)

1、启动、停止mysql服务 1.0 sudo service mysql restart //测试有效 以下未测试 1.1 使用mysqld mysqld start mysqld stop 1.2 使用mysqld_safe启动、关闭MySQL服务 mysqld_safe 1.3 使用mysql.server启动、关闭MySQL服务 mysql.server stop …

15 个 JavaScript Web UI 库

新闻来源:speckboy.com几乎所有的富 Web 应用都基于一个或多个 Web UI 库或框架,这些 UI 库与框架极大地简化了开发进程,并带来一致,可靠,以及高度交互性的用户界面。本文介绍了 15 个非常强大的 JavaScript Web UI 库&#xff0c…

【网络编程】MarioTCP

0、参考博客 《MarioTCP_一个可单机支持千万并发连接的TCP服务器 - JohanFong - CSDN博客》 http://blog.csdn.net/everlastinging/article/details/10894493 1、下载 sourceforge下载:https://sourceforge.net/projects/mariotcp/files/latest/download 2、安装…

Spring MVC-ContextLoaderListener和DispatcherServlet

2019独角兽企业重金招聘Python工程师标准>>> Spring MVC-ContextLoaderListener和DispatcherServlet 博客分类: spring java Tomcat或Jetty作为Servlet容器会为每一个Web应用构建一个ServletContext用于存放所有的Servlet, Filter, Listener。Spring MVC…

《中国人工智能ABC人才发展报告》发布,算法和应用类人才短缺

近日,百度云联手中国传媒大学、BOSS 直聘和百度指数发布了《中国人工智能 ABC 人才发展报告(2018版)》(以下简称“报告”)和百度云智学院2019 年人才认证体系。报告指出,从 2018 年的人才供需状况来看&…

博客域名改为http://bobli.cnblogs.com

本博客的域名已修改为:http://bobli.cnblogs.com/ 原来的地址还可以进入,希望搜索引擎快点更新过来。。。 感谢博客园管理员的帮助,效率非常之高!

百度Apollo 3.5是如何设计Cyber RT计算框架的?

自百度Apollo自动驾驶平台开源以来,已快速迭代至 3.5 版本,代码行数超过 39 万行,合作伙伴超过 130 家,吸引了来自 97 个国家的超 15000 名开发者。无疑,Apollo 是目前世界范围内最活跃的自动驾驶开放平台之一。最新发…

Spark Streaming实践和优化

2019独角兽企业重金招聘Python工程师标准>>> Spark Streaming实践和优化 博客分类: spark 在流式计算领域,Spark Streaming和Storm时下应用最广泛的两个计算引擎。其中,Spark Streaming是Spark生态系统中的重要组成部分&#xff0…

Python | 一万多条拼车数据,看春运的迁徙图

作者 | 白苏,医疗健康领域产品经理一枚,Python&R爱好者来源 | InThirty编辑 | Jane今天是腊月二十八,你们都到家了吗?这篇文章,作者对北京、上海、广州、深圳、杭州等地 1万多条出行数据进行分析,得出了…

[转载] sql server 2000系统表解释

sql server 2000系统表解释汇总了几个比较有用的系统表,内容摘自联机帮助sysobjects---------------在数据库内创建的每个对象(约束、默认值、日志、规则、存储过程等)在表中占一行。只有在 tempdb 内,每个临时对象才在该表中占一…

【驱动】uboot环境变量分析

0、bootcmd 0.1 飞凌原设置 bootcmdif mmc rescan; then if run loadbootscript; then run bootscript; else if test ${bootdev} sd1; then echo update firmware.........;run update_from_sd;else echo mmc boot..........;if run loadimage; then run mmcboot; else run n…

python--属性魔法方法

转载于:https://www.cnblogs.com/Purp1e/p/8149773.html

利用三层交换机实现VLAN的通信实验报告

利用三层交换机实现VLAN的通信实验报告<?xml:namespace prefix o ns "urn:schemas-microsoft-com:office:office" />背景&#xff1a;要想实现VLAN之间的通讯,我们可以采用通过路由器实现VLAN间的通信 使用路由器实现VLAN间通信时&#xff0c;路由器与交换机…