当前位置: 首页 > 编程日记 > 正文

投稿2877篇,EMNLP 2019公布4篇最佳论文

640?wx_fmt=jpeg

整理 | AI科技大本营(ID:rgznai100)

近日,自然语言处理领域的顶级会议之一EMNLP 2019公布了年度最佳论文。
EMNLP是由国际语言学会(ACL)下属的SIGDAT小组主办的自然语言处理领域的顶级国际会议,是自然语言算法的A类会议,聚焦于自然语言算法在各个领域解决方案的学术探讨。EMNLP每年举办一次,今年与IJCNLP联合办会。

640?wx_fmt=png


据悉,EMNLP-IJCNLP 2019共收到有效投稿2877篇,录用683篇,其中长论文465篇, 短论文218篇,录用率为23.7%。其接收的论文涵盖对话交互系统、信息抽取、信息检索和文档分析、词法语义、语言学理论、认知建模和心理语言学、机器翻译与句子级语义学、情感分析和论点挖掘、文本挖掘和NLP应用、文本推理等自然语言处理领域众多研究方向。
EMNLP2019已接收的全部论文地址如下:

https://www.emnlp-ijcnlp2019.org/program/accepted/

最佳论文奖


640?wx_fmt=png

《Specializing Word Embeddings (for Parsing) by Information Bottleneck》

论文链接:
http://cs.jhu.edu/~jason/papers/li+eisner.emnlp19.pdf
摘要:像ELMo和BERT这样的经过预训练的词嵌入包含丰富的句法和语义信息,从而让它们在各种任务上有最好的表现。研究者提出了一种非常快速的变分信息瓶颈(VIB)方法来非线性压缩这些嵌入,仅保留有助于判别解析器的信息。它们将嵌入的单词压缩为离散标签或连续向量。在离散版本中,它们的自动压缩标签形成了备用标签集。研究者通过实验证明,它们的标签可以捕获传统POS标签注释中的大多数信息,而且可以在相同标签粒度下得到更准确的解析标签序列。在连续向量版本中,他们的方法适度压缩词嵌入后可以得到更准确的解析器,简单的降维操作达不到这样的效果。

最佳论文 Runner Up
640?wx_fmt=png
《Designing and Interpreting Probes with Control Tasks》

论文地址:
https://www.aclweb.org/anthology/D19-1275.pdf
摘要:训练的训监督模型可以根据表征(如ELMo)来预测属性(如词性,POS),这种被称为探针的模型在一系列语言任务上均具有很高准确性。但这是否意味着这些表征对语言结构进行了编码,或者仅仅是探针已学习了语言任务?在本文中,研究者提出了控制任务,将单词类型与随机输出相关联,以补充语言学任务。
通过这种操作,这些任务只能由探针本身学习。因此,一个好的探针应该是有选择性的(一个反映该表征的探针),以在语言学任务中实现较高的准确性和在控制任务有较低的准确性。探针的选择性就是将语言任务的准确性与探针记忆单词类型的能力联系起来。
研究者设计了用于英语词性标注和依赖性边缘预测的控制任务,并表明对ELMo表征的流行探针不具选择性。研究者还发现,通常用于控制探针复杂性的dropout方法对提高MLP的选择性无效,但是其他类型的正则化是有效的。最后,它们发现,尽管ELMo的第一层探针比第二层探针的词性标注精度稍高,但是第二层探针的选择性要更好,这带来的问题是哪一层更好地表征POS。
最佳资源奖
640?wx_fmt=png
论文链接:
https://www.aclweb.org/anthology/D19-1632.pdf
数据集地址:
https://github.com/facebookresearch/flores
摘要:世界上绝大多数语言对都是资源匮乏的,因为它们几乎没有并行数据。不幸的是,机器翻译(MT)系统当前在这种情况下不能很好地工作。除了对监督学习的技术挑战之外,这些语言还有另一个挑战:由于缺乏可自由公开使用的基准,因此很难评估在低资源语言上训练的方法优劣。
在这项工作中,研究者们从Wikipedia页面中提取句子,并以两种资源非常匮乏的语言对尼泊尔-英语和僧伽罗-英语引入了新的评估数据集,这些是具有非常不同形态和语法的语言,对于这些语言而言,几乎没有可用的域外并行数据,不过也有相对大量的单语数据可以用。
研究者描述了收集和交叉检验翻译质量的过程,并使用几种学习方式来设置报告基准性能:完全监督、弱监督、半监督和无监督。他们的实验表明,当前最先进的方法在此基准上的表现相当差,这对研究低资源MT的研究社区形成了挑战。

最佳Demo奖

640?wx_fmt=png
《AllenNLP Interpret: A Framework for Explaining Predictions of NLP Models》
论文链接:
https://arxiv.org/abs/1909.09251
摘要:基于神经网络的NLP模型越来越准确,但却不完美且无法解释,最终导致用户对其行为感到困惑。模型解释方法通过对特定模型预测的解释来改善这种不可解释性。不幸的是,现有的模型解释方法很难应用于新的模型和任务,这对从业人员的使用造成了障碍,并给研究可解释性的人员带来负担。
本文研究人员介绍的AllenNLP Interpret,是一个用于解释NLP模型的灵活框架,该工具包为所有AllenNLP模型和任务提供了解释原型(例如输入梯度),一套内置的解释方法以及前端可视化组件库。
他们通过针对各种模型和任务(例如使用BERT的masked language modeling和使用BiDAF的阅读理解)的五种解释方法(如显着性热图和对抗性攻击)实现可视化演示,表明了工具包的灵活性和实用性。

(*本文为AI科技大本营整理文章,转载请微信联系 1092722531


精彩推荐



2019 中国大数据技术大会(BDTC)再度来袭!豪华主席阵容及百位技术专家齐聚,15 场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读,深入解析热门技术在行业中的实践落地。6.6 折票限时特惠(立减1400元),学生票仅 599 元!

640?wx_fmt=png


推荐阅读

相关文章:

对象检测工具包mmdetection简介、安装及测试代码

mmdetection是商汤和港中文大学联合开源的基于PyTorch的对象检测工具包,属于香港中文大学多媒体实验室open-mmlab项目的一部分。该工具包提供了已公开发表的多种流行的检测组件,通过这些组件的组合可以迅速搭建出各种检测框架。 mmdetection主要特性&am…

(转)eclipse 代码自动补全

转自:http://blog.csdn.net/yushuwai2010/article/details/11856129 一般默认情况下,Eclipse的代码提示功能是比MicrosoftVisualStudio的差很多的,主要是Eclipse本身有很多选项是默认关闭的,要开发者自己去手动配置。如果开发者不…

swift 多线程GCD和延时调用

GCD 是一种非常方便的使用多线程的方式。通过使用 GCD,我们可以在确保尽量简单的语法的前提下进行灵活的多线程编程。在 “复杂必死” 的多线程编程中,保持简单就是避免错误的金科玉律。好消息是在 Swift 中是可以无缝使用 GCD 的 API 的,而且…

目标检测算法Faster R-CNN简介

在博文https://blog.csdn.net/fengbingchun/article/details/87091740 中对Fast R-CNN进行了简单介绍,这里在Fast R-CNN的基础上简单介绍下Faster R-CNN。 目标检测领域从R-CNN开始,通过引入卷积神经网络取得了很多突破性的进展,但是始终未能…

ICCV 2019 | 加一个任务路由让数百个任务同时跑起来,怎么做到?

作者 | Gjorgji Strezoski, Nanne van Noord, Marcel Worring 译者 | 中国海洋大学李杰 出品 | AI科技大本营(ID:rgznai100)摘要传统的多任务(MTL)学习方法依赖于架构调整和大型可训练参数集来联合优化多个任务。但是,…

DEV开发之控件NavBarControl

右键点击RunDesigner弹出如下界面鼠标先点击3或4,1,,然后点击1或2进行相应的新增或删除操作,3是分组,4是项目,4可以直接拖动到相应的分组3.属性caption:显示的名称4.NavBarControl 属性 PaintStyleName绘画风格&…

swift支持多线程操作数据库类库-CoreDataManager

类库方法 获取数据 executeFetchRequest(request:) 同步获取数据 var request: NSFetchRequest NSFetchRequest(entityName: "MonkeyEntity")var myMonkeys:NSArray? CoreDataManager.shared.executeFetchRequest(request)异步获取数据 executeFetchRequest(re…

目标检测(或分隔)算法Mask R-CNN简介

在博文https://blog.csdn.net/fengbingchun/article/details/87195597 中对Faster R-CNN进行了简单介绍,这里在Faster R-CNN的基础上简单介绍下Mask R-CNN。 Mask R-CNN是faster R-CNN的扩展形式,能够有效地检测图像中的目标,并且Mask R-CNN…

未来之城,管理者可能不是人......

大会官网 https://t.csdnimg.cn/KSTh2010 年,IBM 正式提出了“智慧地球”愿景。在 IBM 的设想中,智慧城市应该由六个核心系统组成:组织(人)、业务/政务、交通、通讯、水和能源。(图源 | IBM 官网&#xff0…

UVa 10701 - Pre, in and post

题目:已知树的前根序,中根序遍历转化成后根序遍历。 分析:递归,DS。依据定义递归求解就可以。 前根序:根,左子树,右子树; 中根序:左子树,根,右子树…

图像集存储成MNIST数据集格式实现

有时会用到将一组图像存放成MNIST中那样的数据格式,以便于用于网络的训练和测试,如MNSIT中的测试集标签t10k-labels.idx1-ubyte和测试集图像t10k-images.idx3-ubyte,各包含了10000个样本,这里以此两个测试集为例详细说明下实现过程…

ios9定位服务的app进入后台三分钟收不到经纬度,应用被挂起问题及解决方案

原来定位服务是10分钟收不到定位信息就挂起定位,现在变为最短3分钟,估计都是为了省电吧。只要你开启应用的后台定位,并且10分钟有一次定位,那么苹果就不会关闭你的线程,现在变成3分钟。若你的应用开启了后台定位&#…

程序员必知的20个Python技巧

作者 | Duomly 译者 | 弯月,编辑 | 郭芮 出品 | CSDN(ID:CSDNnews)Python是一门流行且应用广泛的通用编程语言,其应用包括数据科学、机器学习、科学计算等领域,以及后端Web开发、移动和桌面应用程序等方面。…

CSS float浮动的深入研究、详解及拓展(二)

为什么80%的码农都做不了架构师?>>> 接上回… 五、浮动的非本职工作 浮动的本职工作是让匿名inline boxes性质的文字环绕图片显示,而其他所有用浮动实现的效果都不是浮动应该做的事情,我称之为“非本职工作”。 或许我们并没有…

不需要显示地图 就获得用户当前经纬度 超简单的方法

1.遵循协议 CLLocationManagerDelegate,AMapSearchDelegate,AMapLocationManagerDelegate 2. API MAMapServices.sharedServices().apiKey APIKey AMapLocationServices.sharedServices().apiKey APIKey AMapSearchServices.sharedServices().apiKey APIKey AMapNaviService…

ELECTRA:超越BERT,2019年最佳NLP预训练模型

作者 | 李如来源 | NLPCAB(ID:rgznai100)【导读】BERT推出这一年来,除了XLNet,其他的改进都没带来太多惊喜,无非是越堆越大的模型和数据,以及动辄1024块TPU,让工程师们不知道如何落地。今天要介…

安装node和spm过程

2019独角兽企业重金招聘Python工程师标准>>> 安装nodejs 官网下载nodejs,我下的是v0.10.33版本,安装到d:\nodejs下。 1.新建目录d:\nodejs,在其中建立node_cache、node_global、node_modules三个目录。 2,将C:\Users…

经典网络LeNet-5介绍及代码测试(Caffe, MNIST, C++)

LeNet-5:包含7个层(layer),如下图所示:输入层没有计算在内,输入图像大小为32*32*1,是针对灰度图进行训练和预测的。论文名字为” Gradient-Based Learning Applied to Document Recognition”,可以直接从ht…

根据经纬度获取用户当前位置信息

根据上篇文章获取的经纬度获取用户当前的位置信息 //获取用户所在位置信息ADDRESS func getUserAddress() { let latitude : CLLocationDegrees LATITUDES! let longitude : CLLocationDegrees LONGITUDES! print("latitude:\(latitude)") print("longitude…

刷了几千道算法题,我私藏的刷题网站都在这里了

作者 | Rocky0429 来源 | Python空间(ID: Devtogether)遥想当年,机缘巧合入了 ACM 的坑,周边巨擘林立,从此过上了"天天被虐似死狗"的生活...然而我是谁,我可是死狗中的战斗鸡,智力不够…

js实现点击li标签弹出其索引值

据说这是一道笔试题&#xff0c;以下是代码&#xff0c;没什么要文字叙述的&#xff0c;就是点击哪个<li>弹出哪个<li>的索引值即可&#xff1a; <html> <head> <style> li{width:50px;height:30px;margin:5px;float:left;text-align: center;li…

定时器开启和关闭

写程序时遇见了定时器&#xff0c;需要写入数据库用户的经纬 &#xff0c;还要读取&#xff0c;写好之后发现很费电 总结原因&#xff1a; 1&#xff1a;地图定位耗电&#xff08;这个根据程序要求&#xff0c;不能关闭&#xff0c;需要实时定位&#xff0c;很无奈&#xff…

一览群智胡健:在中国完全照搬Palantir模式,这不现实

作者 | Just出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;神秘的硅谷大数据挖掘公司 Palantir 是国内众多创业公司看齐的标杆&#xff0c;其业务是为政府和金融领域的大客户提供数据分析服务&#xff0c;帮助客户作出判断&#xff0c;甚至“预知未来”&#xff0c;…

ImageNet图像数据集介绍

ImageNet图像数据集始于2009年&#xff0c;当时李飞飞教授等在CVPR2009上发表了一篇名为《ImageNet: A Large-Scale Hierarchical Image Database》的论文&#xff0c;之后就是基于ImageNet数据集的7届ImageNet挑战赛(2010年开始)&#xff0c;2017年后&#xff0c;ImageNet由Ka…

cocos2dx 场景的切换

我们知道cocos2dx中可以由多个场景组成&#xff0c;那么我是如何来切换场景的呢首先我们先新建一个新的场景类&#xff0c;我推荐的方式是&#xff0c;在你工程的目录中找到一个classes的文件夹&#xff0c;里面有AppDelegate.cpp和AppDelegate.h还有HelloWorldScene.cpp和Hell…

IOS 后台挂起程序 当程序到后台后,继续完成定位任务

// 当应用程序掉到后台时&#xff0c;执行该方法 - (void)applicationDidEnterBackground:(UIApplication *)application { } 当一个 iOS 应用被送到后台,它的主线程会被暂停。你用 NSThread 的 detachNewThreadSelector:toTar get:withObject:类方法创建的线程也被挂起了。 我…

任正非:华为5G是瞎猫碰死老鼠

喜欢话糙理不糙的任正非&#xff0c;又飙金句。11月6日&#xff0c;在和彭博社记者对话时&#xff0c;谈到华为5G&#xff0c;他说&#xff1a;“回顾这个过程&#xff0c;我们也没有什么必胜的信心&#xff0c;有时候也是瞎猫碰上了死老鼠&#xff0c;刚好碰上世界是这个需求。…

网络文件系统(NFS)简介

网络文件系统(Network File System, NFS)是一种分布式文件系统协议&#xff0c;最初由Sun Microsystems公司开发&#xff0c;并于1984年发布。其功能旨在允许客户端主机可以像访问本地存储一样通过网络访问服务器端文件。NFS和其他许多协议一样&#xff0c;是基于开放网络运算远…

JAVA Static方法与单例模式的理解

最近用sonar测评代码质量的时候&#xff0c;发现一个问题&#xff0c;工程中一些util类&#xff0c;以前写的static方法都提示最好用单例的方式进行改正。为此&#xff0c;我仔细想了想&#xff0c;发现还是很有道理的。这里谈谈我个人对static方法与单例模式的理解。所谓单例模…

程序员的自我修养--链接、装载与库笔记:目标文件里有什么

编译器编译源代码后生成的文件叫做目标文件。目标文件从结构上讲&#xff0c;它是已经编译后的可执行文件格式&#xff0c;只是还没有经过链接的过程&#xff0c;其中可能有些符号或有些地址还没有被调整。其实它本身就是按照可执行文件格式存储的&#xff0c;只是跟真正的可执…