2018热点总结:BERT最热,GANs最活跃,每20分钟就有一篇论文...
作者 | Ross Taylor
译者 | linstancy
整理 | Jane
出品 | AI科技大本营
【导读】本文的作者 Ross Taylor 和 Robert Stojnic 在今年一起启动了一个名为“Paper with Code”的项目,将 AI 领域的一些研究论文和论文开源代码结合展示,方便大家学习与研究。在推进这个项目的同时,通过分析网站的数据他们也有一些意外和有趣的收获,用更综合、全面的视野总结了下半年的发展现状与热点,哪些正在成为流行趋势、哪些被广泛使用。
在这篇文章中,作者为大家总结了 2018 年下半年机器学习领域被密切关注的成果,快来看看,这些你是不是都知道呢?
最流行的模型
BERT, vid2vid 和 graph_nets
10月,Google AI 团队提出了一种深度双向 Transformer 模型 (BERT),并发表了相关的论文。该模型在 11 个NLP 任务上取得了目前为止最佳的性能,Stanford Question Answering (SQuAD) 数据集也引起了学术界的强烈关注。随后,Google AI 进一步开源了项目代码,并在当月获得了最多 Stars 数量,可见其热门程度。
论文链接:https://arxiv.org/abs/1810.04805
GitHub 链接:https://github.com/google-research/bert
Nvidia 的 video-to-video synthesis 研究同样是下半年一大热点。该研究提出了一种新颖的生成模型 (GAN) 并在视频合成任务中取得惊人的效果。众所周知,GAN 是过去几年里最受欢迎的深度学习模型之一,该研究团队利用一种新颖的顺序生成器架构,以及一些前景和背景先验 (foreground-and-background priors) 等设计特征,解决了当前视频合成研究中时间不连贯的问题,进而提高了最终的性能。同样地,该项目代码也被 Nvidia 团队开源,并成为今年下半年第二大最受欢迎的项目。
论文链接:https://arxiv.org/abs/1808.06601
GitHub 链接:https://github.com/NVIDIA/vid2vid
同样值得关注的是,Google DeepMind 团队关于图网络 (graph_nets) 的最新研究。该研究得到广泛关注的原因是,因为它为解决结构化数据提供了一种新的方向。该开源项目是 2018 下半年排名第三位的受欢迎项目。
论文链接:https://arxiv.org/abs/1806.01261v3
GitHub 链接:https://github.com/deepmind/graph_nets
最受欢迎的项目
DeOldify、BERT 和 Fast R-CNNs
下面来介绍下半年最受欢迎的三个开源项目。
首先是 DeOldify。这是一项使用生成对抗网络 (GAN) 来修复黑白旧照片并为其重新上色的研究,在深度学习领域引发了极大的兴趣和关注。该项目的作者是 Jason Antic,他借鉴了几种 GAN 模型的实现,包括 self-attention GANs (SA-GANs)、progressively growing GANs (PG-GANs),来构建自己的模型,并采用两种时间跨度的原则,最终得到了有意思的结果。
GitHub 链接:
https://github.com/jantic/DeOldify
其次是 BERT 的 pytorch 实现,作者是 Junseong Kim。该项目的代码基于 The Annotated Transformer,代码风格简单易懂。
GitHub 链接:
https://github.com/codertimo/BERT-pytorch
最后一个项目是 Mask R-CNN 的 Keras/TensorFlow 实现,作者 Waleed Abdulla,这是今年下半年第三个热门 GitHub 项目。在结构上,Mask R-CNN 基于特征金字塔网络 (FPN) 和 ResNet101 为模型骨干,它可用于许多诸如 3D 建筑物重建,自动驾驶中的目标检测,检测地图中的建筑物类型等应用。
GitHub 链接:
https://github.com/matterport/Mask_RCNN
最活跃的领域
NLP 和 GANs
通过查看 GitHub 上 Top50 的开源实现,我们会发现当前最热门、最活跃的研究领域是自然语言处理 (NLP) 和生成对抗模型 (GANs)。在 GitHub 上,GANs 领域最受欢迎的开源项目有 vid2vid,DeOldify,CycleGAN 以及 faceswaps,而最热门的 NLP 开源项目包括 BERT,HanLP,jieba,AllenNLP 以及 fastText。
每7篇新论文中,只有一篇论文附有代码实现
希望研究者在发表论文的同时可以开源自己的代码实现。在过去 5 年的时间里,我们处理了60000 多篇机器学习领域的论文,在这些论文中,只有 12% 的论文开源了它们的代码,而过去 6 个月新发表的论文中,大约只有 15% (即每7篇新论文中只有1篇)附有代码实现。这些数字都告诉我们还有更多的工作要做,但是一切也正朝着正确的方向发展!
每 20 分钟就会出现一篇机器学习论文
从 7 月到现在,机器学习领域论文发表数量的增长率一直维持在每月 3.5% 左右,每年的增长率达到了 50%。这意味着,每月大约有 2200 篇新论文发表,按照这个趋势,预计明年将有近 30000 篇新论文发表。
为了更好描述这是怎样的一个趋势,我们绘制了曲线图与摩尔定律的趋势图进行比较。
最热门的两大深度学习框架
Tensorflow 和 PyTorch
以往每年大部分论文的代码都是基于 Tensorflow 框架实现的,但是,今年 PyTorch 的火热程度无法让人忽视,PyTorch 社区的活跃度非常高。其他的框架,诸如 MXNet,Torch 和 Caffe2 在整个深度学习社区的活跃度和使用率相对就有些低了。 Tensorflow 和 PyTorch 这两大框架都发生了很大的变化,TensorFlow 正朝着 eager execution 的方向发展,并集成了新的 Keras API,而 PyTorch 的改进旨在使用者能够更轻松地构建自己的深度学习模型。
展望
整个领域都开始强调论文的可复现性,虽然目前的数字显示,并不是都能做到,甚至我们还有一段路要走,但也正是如此,帮助大家明确了今后的工作的要求与方向。也希望出了研究人员外,有更多的人加入到开源社区中来。
此外,除了 Google 和 Facebook 这样的大型巨头公司外,独立的 ML 社区 (indie ML community) 也将有助于推动论文复现、代码开源等工作。如果,研究团队和开发社区能更加紧密的联系与合作,相信会产生更多有助于实际应用的机器学习工具,进而让整个领域更加发挥更大的潜力,全速前进。
原文链接:
https://medium.com/atlas-ml/state-of-deep-learning-h2-2018-review-cc3e490f1679
(*本文为AI科技大本营翻译稿件,转载请联系微信1092722531)
公开课预告
◆
文字识别
◆
OCR(文字识别)技术是目前常用的一种AI能力。但一般OCR的识别结果是一种按行输出的半结构化输出。本课程从百度自定义模板文字识别展开,从理论到案例,详细介绍OCR结构化的相关技术,并理清OCR和结构化之间的关系和适用场景。
入群福利:添加小助手微信cadnai2,回复:OCR,加入课程交流群。课程QA,PPT共享。
推荐阅读
20k~50k,“寒冬季”一线城市技术人才依旧紧缺,千里马,赶紧来投!
20张图表达程序员的心酸
Python 爬取爱奇艺腾讯视频 250,000 条数据分析为什么李诞不值得了?
这位 50 岁的海归程序员,当着老板还在天天改 Bug
点击“阅读原文”,打开APP 阅读更顺畅。
相关文章:

android之android.intent.category.DEFAULT的用途和使用
1、要弄清楚这个问题,首先需要弄明白什么是implicit(隐藏) intent什么是explicit(明确) intent。 Explicit Intent明确的指定了要启动的Acitivity ,比如以下Java代码: [java] view plaincopy print? Intent intent new Intent(this, B.class…

MS sql server和mysql中update多条数据的例子
1.MS sql server中使用动态的表名:declare tableName nvarchar(160)set tableName t_stat_alldeclare sql nvarchar(160)print tableNameset sqlselect count(*) from tableNameexec(sql)2.mysql的例子1语句update (select sc,tos,sum(click) as click,product,adp…

OpenGL编程轻松入门(四)
1. 曲面和曲线前面我们讲了如何绘制平面的图形,这一节我们学习如何绘制曲线和曲面。例10:绘制一个曲面,本程序使用二维求值器绘制一个曲面。本例中也有一些特殊效果的操作。#include <windows.h>#include <GL/GLAUX.h>#i…

计算机科学实验教学示范中心,校领导调研计算机科学与技术国家级实验教学示范中心...
4月29日,副校长朱廷珺在实验管理中负责人陪同下,深入计算机科学与技术国家级实验教学示范中心、轨道交通信息与控制国家级虚拟仿真实验教学中心开展实地调研。在计算机实验中心,朱廷珺实地调研了计算机基础实验室、计算机软件实验室、硬件专业…

中科创达孙力:不迷信 AI 算法,智能视觉如何转型升级?
作者 | 若名 出品 | AI科技大本营 近日,中科创达副总裁孙力在 Thunder World 2018 嵌入式 AI 人工智能技术大会上发表了主题演讲,主要分享了以下三方面内容: 视觉的传统技术和挑战 嵌入式视觉AI智能视觉 智能视觉赋能行业的智能化升级转型 …

单元测试与敏捷开发
单元测试与敏捷开发 转载请保留作者信息: 作者:88250 Blog:http:/blog.csdn.net/DL88250 MSN & Gmail & QQ:DL88250gmail.com 在要求项目要尽量快地实现的时候,质量与开发进度上会出现一定的矛盾,…

“AI明星”第四范式C轮融资超10亿元,估值约12亿美元
AI科技大本营消息,12 月 19 日,第四范式宣布完成 C 轮融资,融资金额超过 10 亿元,估值约 12 亿美元。此次投资引入了包括国新、启迪、保利、三峡、中信、农银、交银等战略投资,红杉中国继续追加投资。除了原有股东中国…

精灵图 html为什么会变大,[html] 第128天 精灵图和base64如何选择呢?
可参考https://www.cnblogs.com/wangqi2019/p/10498627.htmlCss Sprites(雪碧图或css精灵),是网页图片处理的一种方式,它允许你将一个页面涉及到的所有零星图片都包含到一张大图中去,这样一来,当访问该页面时,载入的图…

组策略 从入门到精通(十)通过组策略进行软件分发和卸载
其实在前面windows server 2008的一些博文中,已经介绍了如何通过组策略进行软件的分发,在windows server 2003中有些无法完成的软件分发工作在windows server 2008中已经全部纠正了。http://zhengweiit.blog.51cto.com/1109863/291156 今天我们主要来探讨…

RedHatAS4.0-RAID技术
RedHatAS4.0-RAID技术

今晚8点直播 | 详解基于百度自定义模板的OCR结果结构化处理技术
随着行业的发展和技术的成熟,文字识别(OCR)目前已经应用到了多个行业中,比如物流行业快递包裹的分拣,金融行业的支票单据识别输入,交通领域中的车牌识别,以及日常生活中的卡证、票据识别等等。O…

电脑计算机科学型,电脑里附带的计算器有标准型和科学型二种,它 – 手机爱问...
2019-06-24如何用delphi7 0设计标准型计算器这是源代码:unit Unit1;interfaceuses Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms, Dialogs, Buttons, StdCtrls, ExtCtrls;type TForm1 class(TForm) Panel1: TPanel; Panel…

铜缆配线架的选择
我们现在考察一下为安装选择合适的铜缆配线架所必须考虑的因素。铜缆配线架一般分为经济型、中端或高端配线架。经济型配线架经济型配线架通常在结构上脆弱,性能不稳定交缺少技术支持或保证。配线架端接时一般会耗费较多的安装成本,没有电缆管理设备支持…

go6---slice切片
package main/* 切片Slice 其本身并不是数组,它指向底层的数组 作为变长数组的替代方案,可以关联底层数组的局部或全部 为引用类型 可以直接创建或从底层数组获取生成 使用len()获取元素个数,cap()获取容量 一般使用make()创建 如果多个slice…

TensorFlow支持Unicode,中文NLP终于省心了
整理 | 非主流出品 | AI科技大本营终于,TensorFlow 增加了对 Unicode 的支持。什么是 Unicode?Unicode 是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种…

C#:String.Format数字格式化输出
C#:String.Format数字格式化输出 inta 12345678; //格式为sring输出//Label1.Text string.Format("asdfadsf{0}adsfasdf",a);//Label2.Text "asdfadsf"a.ToString()"adsfasdf";//Label1.Text string.Format("asdfadsf{0:C}adsfasdf&…

OpenStack如何实现高可用集群介绍
OpenStack是目前基于开源的,一个非常流行的云管理平台项目。这个项目由几个主要的组件组合起来完成一些具体的工作。因此它的集群比较复杂,也有多种选择方式。OpenStack 作为一个类似于 Amazon EC2 和 S3 的云基础架构服务(Infrastructure as a Service,…
accp8.0html作业,Accp8.0HTML标签
第一章1、HTML超文本标记语言2、网页3、网页头部4、网页标题5、网页主体6、DOCTYPE声明3种级别:(1)Strict 严格类型(2)Transitional过渡类型(3)Frameset框架类型7、网页摘要标签8、字符编码:gb2312简体中文ISO-885901纯英文big5繁体UTF-8国际通用编码9、…

向iOS越狱彻底说再见!
老牌第三方软件商店 Cydia 关闭在即,iPhone 越狱时代又见落日归途?作者 | 仲培艺出品 | CSDNCydia 线上商店是针对完成越狱的 iOS 设备的一种破解软件,在越狱过程中被装入到系统,为 iOS 设备提供第三方 App 的服务平台,…

ArrayList的subList方法
李说: ArrayList的subList方法获取到的是ArrayList的一段list,只是其中的一段视图。所以修改subList ,ArrayList同时会修改,因为本来就是同一个东西。 jdk文档中是这样说的: List<E> subList(int fromIndex, int toIndex) …

男孩子学计算机和学医哪个好,你认为学医好还是读211大学的电子信息好?
学医的好处。社会的地位和社会认可度较高。无可否认无论是在过去还是在将来,医生因为其救死扶伤的职业特点而被广泛大众所接受和认可。较高的社会地位会让你在将来的择偶、人际关系处理方面显得更有吸引力和话语权。工作稳定有保障。这点其实还是看题主的水平和实力…

Error Creating Control when creating a custom control
如果你在创建ASP.NET的Server Control 是遇到报错: "Error Creating Control" when creating a custom control 原因是 ToolboxData 元数据中的控件名称和控件的类(class)名不同,改为相同即可解决问题。转载于:https://www.cnblogs.com/DotNet…

精选180+Python开源项目,随你选!做项目何愁没代码
编辑 | Jane出品 | Python大本营每一位程序员,每天大部分时间都是在和代码打交道。但是对于广大的普通用户来说,最重要的不是代码,而是代码最终生成的应用程序。但是,每个项目都从头开始自己一行一行码代码,是非常不现…

八年级计算机网络公开课,计算机网络公开课教案.doc
计算机网络公开课教案公开课教案科目:计算机网络课题: 交换机配置文件备份与恢复知识目标:1、在本次课中要向学生传授交换机上传、下载服务器的安装和配置;2.学生学习交换机上传配置命令,完成交换机Flash内存中保存的配置文件上传…

Centos6.5升级系统自带gcc4.4.7到gcc4.8.0
下载 wget http://ftp.gnu.org/gnu/gcc/gcc-4.8.0/gcc-4.8.0.tar.bz2 解压 tar -xjvf gcc-4.8.0.tar.bz2 进入 cd gcc-4.8.0 下载所需软件( ftp://gcc.gnu.org/pub/gcc/infrastructure/mpfr-2.4.2.tar.bz2 ftp://gcc.gnu.org/pub/gcc/infrastructure/gmp-4.3.2.tar.…

photofunia
存个链接用~~~[url]http://www.photofunia.com/[/url]转载于:https://blog.51cto.com/wangyublues/120301

学计算机应用好还是汽车维修好,大学汽车运用与维修专业怎么样_学什么_前景好吗-520吉他网...
时间:2019-06-23 来源:网络资源 汽车运用与维修专业怎么样_学什么_前景好吗2019高考填报志愿时,汽车运用与维修专业怎么样、学什么、前景好吗等是广大考生和家长朋友们十分关心的问题。以下是大学生必备网整理的汽车运用与维修专业介绍、…

20T数据、百万奖金,同济和武大摘得开放数据创新应用大赛桂冠!
整理 | Jane出品 | AI科技大本营中国华录杯城市开放数据创新应用大赛,18 日在天津迎来了收官的决赛之战。本次大赛由中国华录集团有限公司和天津市津南区人民政府共同举办。利用天津市人民政府、企业开放的数据资源,吸引了众多国内高校科研团队和科技企业…

rrdtool报错
参考文档: http://serverfault.com/questions/662161/rrdtool-illegal-attempt-to-updatehttps://emacstragic.net/collectd-causing-rrd-illegal-attempt-to-update-using-time-errors/https://support.nagios.com/forum/viewtopic.php?f7&t26087 报错信息&am…

Grid R-CNN解读:商汤最新目标检测算法,定位精度超越Faster R-CNN
作者 | 周强来源 | 我爱计算机视觉Grid R-CNN是商汤科技最新发表于arXiv的一篇目标检测的论文,对Faster R-CNN架构的目标坐标回归部分进行了替换,取得了更加精确的定位精度,是最近非常值得一读的论文。今天就跟大家一起来细品此文妙处。一、作…