当前位置: 首页 > 编程日记 > 正文

BERT拿下最佳长论文奖!NAACL 2019最佳论文奖公布

640?wx_fmt=gif点击上方↑↑↑蓝字关注我们~

640?wx_fmt=jpeg

2019 Python开发者日」全日程揭晓,请扫码咨询 ↑↑↑


作者 | 刘静

编辑 | 李尔客

本文经授权转自公众号图灵Topia(ID:turingtopia)


今日,自然语言处理顶会NAACL 2019最佳论文奖公布,BERT大力出奇迹,获得最佳长论文奖!


同时,NLP 领域的华人新星王威廉提名的论文获得最佳短文奖。 


640?wx_fmt=png


ACL、EMNLP、NAACL - HLT、COLING 是 NLP 领域的四大顶会。前三者都由 ACL(Association of Computational Linguistics)举办, 其中 NAACL - HLT(Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies,一般简称为 NAACL)虽然名义上只是 ACL 北美分会,但在 NLP 圈里也是无可争议的顶级会议,名称中的 HLT 也直接宣告了对于人类语言处理技术的关注。


据官方统计,此次 NAACL 2019 共收到论文 1955 篇论文,共接收论文 424 篇,录取率仅为 22.6%。其中收到长论文投稿 1198 篇,短论文 757 篇。


640?wx_fmt=jpeg


今年总论文投稿的数量比去年多了近 1 倍,但在录取论文数量上却只增加了大约 100 篇,整体的论文录取率不增反降了,录取率降低的背后意味着对论文质量的标准更高,审稿也更加严苛。


以下是NAACL2019所有获奖论文:


Best Thematic Paper(最佳主题论文)


《What’s in a Name? Reducing Bias in Bios Without Access to Protected Attributes》

(减少Bios中的偏差,无需访问受保护属性)


地址:

https://arxiv.org/pdf/1904.05233v1.pdf


摘要:越来越多的工作提出了减轻机器学习系统偏差的方法。这些方法通常依赖于对受保护属性(如种族,性别或年龄)的访问。然而,这提出了两个重大挑战:(1)受保护的属性可能不可用或使用它们可能不合法,(2)通常需要同时考虑多个受保护的属性及其交叉点。在减轻职业分类偏差的背景下,我们提出了一种方法,用于阻止个体真实职业的预测概率与其名称的单词嵌入之间的相关性。此方法利用了在字嵌入中编码的社会偏见,从而无需访问受保护的属性。至关重要的是,它只需要访问个人 在培训时而非部署时的名称。我们使用大规模在线传记数据集评估了我们提出的方法的两种变体。我们发现这两种变异同时会减少种族和性别偏见,而分类者的整体真实阳性率几乎没有降低。


Best Explainable NLP Paper(最佳可解释NLP论文)


《CNM: An Interpretable Complex-valued Network for Matching》

(CNM:一个可解释的复值网络匹配)


地址:

http://arxiv.org/pdf/1904.05298v1


摘要:本文试图通过量子物理的数学框架对人类语言进行建模。利用量子物理学中精心设计的数学公式,该框架将单个复值向量空间中的不同语言单元统一起来,例如像量子态中的粒子和作为混合系统的句子。构建复值网络以实现用于语义匹配的该框架。通过良好约束的复值组件,网络允许对明确的物理意义进行解释。所提出的用于匹配的复值网络(CNM)在两个基准问答数据集(QA)上实现了与强CNN和RNN基线相当的性能。


Best Long Paper(最佳长论文)


《BERT:Pretraining of Deep Bidirectional Transformers for Language Understanding》


(BERT - 用于语言理解的深度双向预训练转换器)


地址:

https://arxiv.org/abs/1810.04805


摘要:这个大家已经耳熟能详了,BERT刷新了11项自然语言处理任务的最新成果,包括将GLUE基准推至80.4%(绝对改进率7.6%),MultiNLI准确度达到86.7(绝对改进率5.6%)和SQuAD v1.1问题回答测试F1到93.2(绝对改进1.5%),超过人类表现2.0%。


Best Short Paper(最佳短论文)


《Probing the Need for Visual Context in Multimodal Machine Translation》

(探索多模态机器翻译中视觉语境的需求)


地址:

https://arxiv.org/abs/1903.08678


摘要:目前关于多模态机器翻译(MMT)的工作表明,视觉模态要么不必要,要么只是略微有益。我们认为这是在任务的唯一可用数据集(Multi30K)中使用的非常简单,简短和重复的句子的结果,使源文本足以作为上下文。然而,在一般情况下,我们认为可以将视觉和文本信息结合起来以便进行地面翻译。在本文中,我们通过系统分析来探讨视觉模态对最先进的MMT模型的贡献,其中我们部分地剥夺模型从源侧文本上下文。我们的结果表明,在有限的文本背景下,模型能够利用视觉输入来生成更好的翻译。


Best Resource Paper(最佳资源论文)


《CommonsenseQA: A Question Answering Challenge Targeting Commonsense Knowledge》

(CommonsenseQA:针对常识知识的问题回答挑战)


地址:

https://arxiv.org/abs/1811.00937


摘要:在回答问题时,除了特定的背景之外,人们还经常利用他们丰富的世界知识。最近的工作主要集中在给出一些相关文件或背景的问题,并且只需要很少的一般背景。为了研究具有先验知识的问题回答,我们提出了CommonsenseQA:一个具有挑战性的常见问题解答新数据集。为了捕捉关联之外的常识,我们从ConceptNet(Speer et al。,2017)中提取了与单个源概念具有相同语义关系的多个目标概念。要求群众工作者撰写提及源概念的多项选择题,并在每个目标概念之间进行区分。这鼓励工人用复杂的语义创建问题,这些问题通常需要先验知识通过这个程序提出了247个问题,并通过大量强大的基线证明了我们的任务难度。我们最好的基线是基于BERT-large(Devlin等,2018)并获得56%的准确度,远低于人类表现,即89%。


(本文为 AI科技大本营转载文章,转载请微信联系原作者)



倒计时两天


「2019 Python开发者日」演讲议题全揭晓!这一次我们依然“只讲技术,拒绝空谈”10余位一线Python技术专家共同打造一场硬核技术大会。更有深度培训实操环节,为开发者们带来更多深度实战机会。目前大会倒计时 2 天,更多详细信息请咨询13581782348(微信同号)。


640?wx_fmt=jpeg

推荐阅读:


  • 39个国外SCI抢发6万篇中国英文论文?然而,真正的问题是……

  • 专访博世王红星:大数据和AI将是中国制造业升级新动力

  • 抵制996!Python之父发声背后,这个社区一呼百应!

  • 什么是网络爬虫?有什么用?怎么爬?终于有人讲明白了

  • 京东或将裁员 12000 人!雷军年薪百亿;马云:阿里没人敢跟我打赌 | 极客头条

  • 偷电、挖矿、赚快钱,这些大学生到底怎么了?

  • 终于有人把5G和边缘计算的关系说清楚了 | 技术头条

  • 频繁跳槽涨工资?会影响征信的!| 畅言

  • 刺激!我31岁敲代码10年,明天退休!


640?wx_fmt=png


点击“阅读原文”,了解「2019 Python开发者日」

相关文章:

Git Bash修改默认路径

Git Bash默认安装在C:/user目录下,如果管理其他目录的代码库,需要切换目录。 修改Git Bash的默认路径,不需要每次切换了。 方法: 桌面Git Bash快捷方式,右键-->属性-->“快捷方式”标签 1,修改“起止…

NextGEN Gallery ~ 最强WordPress相册插件

博客照片很多?上传和管理图片太烦?想幻灯显示相册?在博客中任意插入动态图片效果?…… 你和我一样,需要NextGEN Gallery,最强WordPress相册插件! 其实网上可以搜到不少关于这个插件的介绍&#…

【经验】网络加速:pip

一、python pip下载加速 参考博客:让PIP源使用国内镜像,提升下载速度和安装成功率。 pip/anaconda修改镜像源,加快python模块安装速度 1、Linux下 修改 ~/.pip/pip.conf (没有就创建一个文件夹及文件。文件夹要加“.”,表示是隐…

iframe 有那些缺

*iframe 会阻塞主页面的 Onload 事 *iframe 和主页面共享连接池,而浏览器对相同域的连接有限制(6-8前),所以会影响页面的并行加 使用 iframe 之前需要考虑这两个缺点。如果需要使用 iframe,最通过 javascrit 动态给 iframe 添加 src 属性值&a…

用Python让蔡徐坤在我的命令行里打篮球!|附完整代码

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」全日程揭晓,请扫码咨询 ↑↑↑来源 | 01二进制(ID:gh_d1999add1857)编辑 | Jane【导语】作者自称是一个经常逛 B 站的肥宅。最近 B 站上流行的视频素材除了“换脸”,其次就要属…

javascript 操作Word和Excel的实现代码

1.保存html页面到word 复制代码 代码如下:<HTML> <HEAD> <title> </title> </HEAD> <body> <form id"form"> <table id "PrintA" width"100%" border"1" cellspacing"0" cel…

【C++】C++11新增关键字详解

目录一、auto1、auto 用来声明自动变量&#xff0c;表明变量存储在栈&#xff08;C11之前&#xff09;2、auto用于推断变量类型示例&#xff08;C11&#xff09;3、声明或定义函数时作为函数返回值的占位符&#xff0c;此时需要与关键字 decltype 一起使用。&#xff08;C11&am…

linux批量创建用户和密码

老男孩教育第五关实战考试题&#xff1a;批量创建10个用户stu01-stu10&#xff0c;并且设置随机8位密码&#xff0c;要求不能用shell的循环&#xff08;例如&#xff1a;for,while等&#xff09;&#xff0c;只能用linux命令及管道实现。 方法1&#xff1a;[rootoldboy /]# ech…

“重构”黑洞:26岁MIT研究生的新算法 | 人物志

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」全日程揭晓&#xff0c;请扫码咨询 ↑↑↑整理 | 若名出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;这是一个重要时刻。除了发布跟丈夫的两张合照外&#xff0c;Katie Bouman 在 Facebook 上鲜有内容更新&#…

【Ubuntu】VirtualBox显卡驱动VBoxVGA、VBoxSVGA、VMSVGA +3D对播放视频的影响

一、VBOXVGA、VMSVGA、VBOXSVGA简述 VBOXVGA和VBOXSVGA是vbox自己的&#xff0c;SVGA比VGA先进一点&#xff0c; VBoxSVGA: 使用Linux或者 Windows 7或者更高版本的新vm的默认图形控制器。 与传统的VBoxVGA选项相比&#xff0c;此图形控制器可提高性能和3D支持。 VBoxVGA: 将这…

MFC中利用CFileDialog选择文件并读取文件所遇到的问题和解决方法

在用MFC编写一个上位机时&#xff0c;需要实现选择和读取一个二进制文件&#xff0c;本来以为很简单的但是在实现过程中遇到很多问题&#xff0c;所幸都一一解决&#xff0c;这里做一下记录。 首先在实现文件选择&#xff0c;在界面上设置一个按钮&#xff0c;并在点击事件函数…

百度智能云一口气发布 14 个新产品,三大视频解决方案,产品最高降价 50%

产业智能化的浪潮正在加速传统互联网行业的升级&#xff0c;视频行业将成为最大的受益者。4 月 11 日&#xff0c;在 2019ABC INSPIRE 百度云智峰会上&#xff0c;百度副总裁、百度智能云总经理尹世明宣布&#xff0c;“百度云” 品牌全面升级为 “百度智能云”&#xff0c;以 …

开源代码hosting openfoundryfrom tw

http://www.openfoundry.org

倒计时1天!「2019 Python开发者日」报名即将关闭(附参会提醒)

「2019 Python开发者日」倒计时最后1天&#xff0c;仅剩少量余票&#xff0c;请扫码咨询 ↑↑↑相信很多人听过之前的 Python 进入小学课本、Python 进入浙江省高考等新闻&#xff0c;那么&#xff0c;有这么多头衔加持的 Python 究竟魅力在哪&#xff1f;与人工智能、大数据捆…

【Gstreamer】在虚拟机中无法使用硬件加速:gstreamer1.0-vaapi

1、问题描述 在虚拟机中,使用gstreamer播放视频,在没有安装gstreamer1.0-vaapi库时,还是正常的;在安装gstreamer1.0-vaapi后,不能播放视频。 错误信息如下: libva info: VA-API version 0.39.0 libva info: va_getDriverName() returns -1 libva error: va_getDriverNa…

如何在阿里云上安全的存放您的配置 - 续

在《如何在阿里云上安全的存放您的配置》一文中&#xff0c;我们介绍了如何通过ACM存放您的敏感配置&#xff0c;并进行加密。这样做的目的有两个&#xff1a; 在应用程序或对应生产环境容器或系统中&#xff0c;无需持久化任何敏感数据信息(如数据库连接串&#xff0c;等)&…

VLAN-VTP-Trunk

VLAN(Virtual LAN) VLAN可以隔离2层的广播域。A VLAN &#xff1d;&#xff08;一个&#xff09; 广播域 &#xff1d; &#xff08;一个&#xff09;逻辑子网路由器是隔离广播域的单个端口只能承载单个VLAN的流量。使用VLAN好处&#xff1a;1.有效的带宽利用2.提高了安全性3…

科大讯飞刷新纪录,机器阅读理解如何超越人类平均水平? | 技术头条

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」明日开启&#xff0c;扫码咨询 ↑↑↑记者 | 琥珀出品 | AI科技大本营&#xff08;公众号ID&#xff1a;rgznai100&#xff09;对于日常从事模型训练的研究人员来讲&#xff0c;无论是图像处理还是语音识别&#xff0c;都离…

【经验】Lenovo/ThinkPad 进入BIOS的方法汇总

1、快捷汇总 联想电脑进入BIOS的快捷键有“F2、F1、Del/Delete、NOVO开机”&#xff0c;部分机型按F2、F1时需要FN键配合 2、常用键 Lenovo笔记本&#xff1a;F2 Fn Lenovo台式机&#xff1a;F2 ThinkPad&#xff1a;F1 联系官网说明&#xff1a; http://tsonline.lenovo.…

NO.7 今天我们是实用派,看看业务选择和部署以及常用故障解决方案是怎么做的...

Hello&#xff0c;大家好&#xff0c;这是第七期 上云用户必看期刊&#xff0c;本期我们主打实用派的相关业务选择和部署以及一些常用故障解决方案做分享。 今天我们不平凡&#xff0c;成为实用派 运维工程师需要掌握的技能https://yq.aliyun.com/articles/591171?spma2c4e.11…

php基础知识

一&#xff1a;php变量#一、PHP的变量定义&#xff1a;变量用于存储值&#xff0c;比如数字、文本字符串或数组、五中&#xff1a;string /integer /double /array /object 命名规则:1、PHP的变量名是区分大小写的。 2、变量名必须以$开头 3、变量名开头可以是下划线 4、变量名…

【Qt】QPixmap加载图片报错:Corrupt JPEG data: premature end of data segment Didn‘t expect more than one scan

1、问题描述 在使用QPixmap加载图片时失败&#xff0c;错误信息如下 Corrupt JPEG data: premature end of data segment Didnt expect more than one scan使用QPicture加载时错误信息如下&#xff1a; QPicturePaintEngine::checkFormat: Incorrect header QPicturePaintEng…

Python超越Java,Rust持续称王!Stack Overflow 2019开发者报告

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」明日开启&#xff0c;扫码咨询 ↑↑↑作者 | 郭芮出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;导语&#xff1a;2019 年 Stack Overflow 开发者调查报告最新出炉了&#xff01;今年&#xff0c;近 90,000 名…

electron打包可选择安装位置,可自动更新

Electron打包调参软件&#xff08;windows版&#xff09; ----------------------------------可选安装位置&#xff0c;可自动更新&#xff0c;手动更新 一&#xff1a;引包&#xff1a;electron,electron-builder&#xff0c;electron-updater** npm i electron --save-dev n…

osi 模型 tcpip网络模型

OSI网络分层参考模型  网络协议设计者不应当设计一个单一、巨大的协议来为所有形式的通信规定完整的细节&#xff0c;而应把通信问题划分成多个 小问题&#xff0c;然后为每一个小问题设计一个单独的协议。这样做使得每个协议的设计、分析、时限和测试比较容易。协议划分的一…

我在旷视研究院做检测 | 技术头条

作者 | 俞刚&#xff0c;旷视研究院Detection组负责人。2014年博士毕业于新加坡南洋理工大学&#xff0c;加入旷视。主要负责检测&#xff0c;分割&#xff0c;跟踪&#xff0c;骨架&#xff0c;动作行为等方面的研究以及算法落地工作。俞刚博士带队参加 2017 COCOPlaces 挑战赛…

【Ubuntu】ubuntu设置GUI程序自启动

1、在启动脚本中添加 在脚本中添加&#xff0c;如“/etc/rc/”“etc/rc.d”“/etc/rc?.d”“/ect/profile”“.bash_profile”等等。 百度下有很多讲解&#xff0c;这里不再赘述。 2、利用ubuntu界面系统启动 终端中执行&#xff1a;gnome-session-properties&#xff0c;出…

(转)关于数据库主键和外键(终于弄懂啦)

一、什么是主键、外键&#xff1a; 关系型数据库中的一条记录中有若干个属性&#xff0c;若其中某一个属性组(注意是组)能唯一标识一条记录&#xff0c;该属性组就可以成为一个主键 比如 学生表(学号&#xff0c;姓名&#xff0c;性别&#xff0c;班级) 其中每个学生的学号是唯…

浏览器兼容:IE6,IE7,IE8,FIREFOX,Chrome

javascript部分1. document.form.item 问题问题&#xff1a;代码中存在 document.formName.item("itemName") 这样的语句&#xff0c;不能在FF下运行解决方法&#xff1a;改用 document.formName.elements["elementName"]2. 集合类对象问题问题&#xff1a…

如何将DynamoDB的数据增量迁移到表格存储

为什么80%的码农都做不了架构师&#xff1f;>>> 摘要&#xff1a; AWS 的 Amazon DynamoDB 和阿里云的表格存储 TableStore 都是完全托管的NoSQL数据库服务&#xff0c;提供快速的、可预期的性能&#xff0c;并且可以实现无缝扩展。本篇文章介绍了如何使用 Lambda …