当前位置: 首页 > 编程日记 > 正文

自然语言处理十问!独家福利

640?wx_fmt=png 
最近,NLP 圈简直不要太热闹!预训练模型频频刷新榜单,让一众研究者、开发者“痛并快乐着”。 自 2018 年 10 月,Google 提出 BERT 以来,NLP 领域预训练模型的发展仿佛坐上了火箭,完全控制不住。 BERT 出世前,大家都在关注着基于 Word Embedding 的 Word2Vec 方法。2017 年 6 月,Google 提出 Transformer 网络,而 2018 年 2 月提出的 ELMO 并没有使用 Transformer;4 个月后,OpenAI 提出的基于 Transformer 的 GPT 预训练模型受到了业界的关注。直到 2018 年 10 月,BERT 的横空出世震动了整个 NLP 领域,一下刷新了 11 项 NLP 任务,成为 NLP 技术发展史上一个里程碑事件。随后,NLP 预训练模型技术的“屠榜”之路便一发不可收拾。 BERT 之后,2019 年 2 月,OpenAI 便发布了 GPT2.0,再次刷爆 NLP 圈。ICML 2019 上微软又提出了一个全新的通用预训练方法MASS,在序列到序列的自然语言生成任务中全面超越BERT和GPT;2019 年 6 月,Google 联合 CMU 发布了碾压 BERT 的 XLNet 模型;2019 年 7 月,榜单再度被刷新,这次荣登榜首的是 Facebook AI 提出的 RoBERTa。 国内学术界和产业界对 NLP 预训练模型技术的跟进也非常迅速。2019 年 3 月百度首次发布适用于中文任务的预训练模型 ERNIE,7 月 31 日,百度发布升级版的 ERNIE 2.0,其在英文任务中也取得了全新突破,并在 16 项中英文任务上超越 BERT 和 XLNet,取得了 SOTA 结果(当前最佳结果)。 640?wx_fmt=png640?wx_fmt=png BERT 之后,预训练模型技术在飞速发展,不断有新工作提出,简直让不少学习者感叹“这速度简直跟不上啊”!不断更新的新技术将对 NLP 领域产生怎样的影响?这些技术在实际场景中被应用的如何了?取得了哪些应用进展?未来的路又在何方? 也许,BERT 的出现,让大家看到了 NLP 发展的新希望,让更多的开发者入局;也许,还有很多开发者处于观望状态,这一切是否仍然是泡沫?相信大部分人都会有各种各样的疑问,不过有疑问不是坏事,我们正是在不断摸索中前进的。 是否,你的心中有很多疑问,却无处可问,无人可答?这次,AI科技大本营联合 AI ProCon 2019(AI 开发者大会)为大家准备了独家福利! 什么福利? 说出你的问题,我们将邀请 AI开发者大会(AI ProCon)NLP 论坛的诸位重磅嘉宾为你答疑解惑。 

嘉宾阵容

 
  • 张俊林:

    新浪微博机器学习团队 AI Lab 负责人(专题出品人)

 640?wx_fmt=png 中国中文信息学会理事,中科院软件所博士。目前担任新浪微博机器学习团队AI Lab负责人。在此之前,张俊林曾经在阿里巴巴任资深技术专家并负责新技术团队,以及在百度和用友担任技术经理及技术总监等职务。他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届优秀图书奖)、《大数据日知录:架构与算法》的作者。 
  • 刘群:

    华为诺亚方舟实验室 语音语义首席科学家

 
640?wx_fmt=png 自然语言处理和机器翻译领域的国际著名专家,研究方向包括多语言信息处理、机器翻译模型、方法与评价等。曾任中国科学院计算技术研究所的研究员和自然语言处理研究组负责人;爱尔兰都柏林城市大学教授、爱尔兰ADAPT研究中心(前身CNGL研究中心)自然语言处理主题负责人。带领团队获得 ACL 2019 最佳长论文奖;最初领导研制的ICTCLAS开源系统是应用最广泛的中文词语切分和词性标注工具。在自然语言处理顶级会议和期刊上发表论文60余篇,迄今为止被引用6900余次(GoogleScholar),相关成果获得了北京市科学技术二等奖和国家科技进步二等奖,并授权给很多企业推广应用。刘群教授已培养硕士博士研究生40余人,很多学生已成为一些大学自然语言处理和机器翻译领域的活跃研究人员和一些大型互联网企业的机器翻译团队的负责人。 
  • 初敏:

    思必驰副总裁、北京研发院院长

 640?wx_fmt=png 中科院声学所博士,主要研究方向覆盖语音识别与合成、自然语言处理、机器学习和数据挖掘、大数据处理和计算等,在相关领域发表了近百篇学术论文并取得 20 多项国内外专利。2000 年,加入微软,在微软亚洲研究院从事科学研究近 10 年,创建并领导语音合成研究小组,研制出了第一个中英文双语语音合成系统“木兰”;2009 年入职阿里巴巴,担任阿里 iDST 智能语音交互方向负责人,使 Yun OS、支付宝、手机淘宝、钉钉等产品具备语音交互能力;2017 年加入思必驰,担任思必驰 VP、思必驰北京研发院院长,拓展语音技术在物联网外的新业务、新场景的落地。 
  • 周力:

    微软小冰全球首席架构师及研发总监

 640?wx_fmt=png 美国南加州大学计算机系博士、北京大学计算机系学士。2014 年周力加入微软小冰团队,任微软小冰全球首席架构师及研发总监,成功开发出独具情商的人工智能系统微软小冰。 
  • 邵浩:

    上海瓦歌智能有限公司总经理,狗尾草科技人工智能研究院院长

 640?wx_fmt=png 日本国立九州大学工学博士。现任上海瓦歌智能科技有限公司总经理,深圳狗尾草智能科技有限公司合伙人,人工智能研究院院长,带领团队打造了聊天机器人产品“公子小白”及AI虚拟生命产品“琥珀•虚颜”的交互引擎。上海市静安区首届优秀人才,兼任中国中文信息学会青年工作委员会委员,中国计算机学会YOCSEF上海学术委员会委员。研究方向为人工智能,共发表论文40余篇,出版了业内第一本聊天机器人著作,主持多项国家级及省部级项目,曾在联合国、WTO、亚利桑那州立大学、香港城市大学等任访问学者。 
  • 崔一鸣:

    科大讯飞 AI 研究院资深研究员

 640?wx_fmt=png 长期从事阅读理解、问答系统、机器翻译等自然语言处理相关领域的研究工作。曾获国际口语机器翻译评测(IWSLT 2012、IWSLT 2014),NIST机器翻译评测(NIST OpenMT 15)多项冠军。2017年至今带领团队多次获得国际权威机器阅读理解评测冠军,其中包括SQuAD 1.1、SQuAD 2.0挑战赛冠军,国际语义评测SemEval 2018阅读理解任务冠军,对话型阅读理解挑战赛CoQA、QuAC冠军等。同时,在自然语言处理顶级及重要国际会议(ACL/AAAI/IJCAI/COLING/NAACL)上发表多篇学术论文,并担任ACL系列会议及AAAI等国际会议程序委员会委员,担任JCSL、TKDD等国际ESI期刊审稿人等学术职务。 更多嘉宾正在确定中……
(最终出席嘉宾以现场为准)

如何参与

 如何提问?扫描下方小助手二维码,加入大会福利交流群”,在群里 @小助手,提出你的问题即可,提问格式:问题:xxxxx提问者:(群内昵称)


社群福利

扫码添加小助手,回复:大会,加入2019 AI开发者大会福利群,即可参与提问活动!程序猿(媛)们还可以在群内参与七夕拼团活动~~

640?wx_fmt=jpeg


在问题汇总之后,我们将从中挑选 10 个问题让专家进行解答。 拼手速的时候到了!速速进群,留下你的疑问~(被 Pick 的小伙伴,还将有机会获得AI科技大本营为大家准备的精美礼品一份:CSDN 二十周年纪念版T恤一件或技术图书一本)
问题收集时间:2019 年 8 月 5 日--8 月 12 日
问题解答时间:2019 年 8 月 12 日--8 月 18 日答案公布时间:2019 年 8 月19 日--2019 年 8 月 25 日答案公布,敬请关注AI科技大本营! 更多精彩内容欢迎大家来到 2019 AI开发者大会(AI ProCon)现场,和各位专家面对面交流~


精彩推荐



640?wx_fmt=png


60+技术大咖与你相约 2019 AI ProCon!七夕套票,限时三天!速抢进行中......2019 AI开发者大会将于9月6日-7日在北京举行,这一届AI开发者大会有哪些亮点?一线公司的大牛们都在关注什么?AI行业的风向是什么?2019 AI开发者大会,倾听大牛分享,聚焦技术实践,和万千开发者共成长。


推荐阅读

  • 通俗易懂:图解10大CNN网络架构

  • AI+DevOps正当时

  • 5天破10亿的哪吒,为啥这么火,Python来分析

  • 5G+AI重新定义生老病死

  • 北上深人均月薪超 2 万元,清华近三成毕业生年入 50 万+,5G 人才月薪超 4 万

  • 如何从零开始设计一颗芯片?

  • 在其他国家被揭穿骗子又盯上非洲? 这几个骗子公司可把非洲人民坑苦了…

  • 国内首款 5G 机型开售;Google Chrome 大部分插件无人用;Firefox 69 Beta 9 发布 | 极客头条


640?wx_fmt=png你点的每个“在看”,我都认真当成了喜欢


相关文章:

BERT的成功是否依赖于虚假相关的统计线索?

作者 | 李理来源 | 个人博客导读:本文介绍论文Probing Neural Network Comprehension of Natural Language Arguments,讨论BERT在ACRT任务下的成绩是否依赖虚假的统计线索,同时分享一些个人对目前机器学习尤其是自然语言理解的看法。目录论文…

【电子基础】模拟电路问答

模拟电路基础知识问答整理 mystery 1、温度对半导体材料的导电性能有什么影响? 答:温度对半导体的导电性能有很大影响。当温度升高时,半导体材料内的自由电子和空穴数量迅速增加,半导体的导电性能将迅速提高。 2、什么是本征半导体和杂质半导…

XML解析简介及Xerces-C++简单使用举例

XML是由World WideWeb联盟(W3C)定义的元语言。它已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。XML在不同的语言里解析方式都是一样的,只不过实现的语法不…

[干货]Kaggle热门 | 用一个框架解决所有机器学习难题

新智元推荐 来源:LinkedIn 作者:Abhishek Thakur 译者:弗格森 【新智元导读】本文是数据科学家Abhishek Thakur发表的Kaggle热门文章。作者总结了自己参加100多场机器学习竞赛的经验,主要从模型框架方面阐述了机器学习过程中可能会…

gtest简介及简单使用

gtest是一个跨平台(Liunx、Mac OS X、Windows、Cygwin、Windows CE and Symbian)的C测试框架,有google公司发布。gtest测试框架是在不同平台上为编写C测试而生成的。从http://code.google.com/p/googletest/downloads/detail?namegtest-1.7.0.zip&can2&q下…

新浪微博推广网站的一些实践体会

本以为微博推广很难,每天都要刷粉刷内容的,也本以为做微博推广也很简单,一不卖产品、二不卖服务的,目的单纯灵活性强些,做了之后才发现都不是那么回事,微博虽然也过了“火了”,但新媒体还真是不…

AI和大数据如何落地智能城市?京东城市这6篇论文必读 | KDD 2019

来源 | 京东城市(ID: icity-jd)作为世界数据挖掘领域的最高级别的学术会议,ACM SIGKDD(国际数据挖掘与知识发现大会,简称 KDD)将于 2019 年 8 月 4 日—8 日在美国阿拉斯加州安克雷奇市举行。自 1995 年以来…

OSError: Could not find library geos_c or load any of its variants ['libgeos_c.so.1', 'libgeos_c.so

OSError: Could not find library geos_c or load any of its variants [libgeos_c.so.1, libgeos_c.so 解决: sudo vim /etc/ld.so.conf 添加:/opt/source/geos-3.5.0/build/lib sudo ldconfig

五分钟搭建BERT服务,实现1000+QPS​,这个Service-Streamer做到了

作者 | 刘欣简介:刘欣,Meteorix,毕业于华中科技大学,前网易游戏技术总监,现任香侬科技算法架构负责人。之前专注游戏引擎工具架构和自动化领域,2018年在GDC和GoogleIO开源Airtest自动化框架,广泛…

Nagios+pnp4nagios+rrdtool 安装配置为nagios添加自定义插件(三)

nagios博大精深,可以以shell、perl等语句为nagios写插件,来满足自己监控的需要。本文写mysql中tps、qps的插件,并把收集到的结果以图形形式展现出来,这样输出的结果就有一定的要求了。 编写插件tps qps check_qps 插件如下内容 #…

OpenSSL简介及在Windows、Linux、Mac系统上的编译步骤

OpenSSL介绍:OpenSSL是一个强大的安全套接字层密码库,囊括主要的密码算法、常用的密钥和证书封装管理功能及SSL协议,并提供丰富的应用程序供测试或其它目的使用。 SSL是SecureSockets Layer(安全套接层协议)的缩写,可以在Interne…

Guava Cache本地缓存在 Spring Boot应用中的实践

概述 在如今高并发的互联网应用中,缓存的地位举足轻重,对提升程序性能帮助不小。而 3.x开始的 Spring也引入了对 Cache的支持,那对于如今发展得如火如荼的 Spring Boot来说自然也是支持缓存特性的。当然 Spring Boot默认使用的是 SimpleCache…

Windows 8.1 Preview(Windows Blue)预览版简体中文官方下载(ISO完整版镜像)

Windows 8.1是微软继Windows 8以来的又一全新力作,又名Windows Blue(视窗蓝,专注蓝屏30年),个人觉得Win8还是比较流畅的但大众始终觉得还是有很多需要改进或者改善的,如今微软为了迎合大众需求对Win8进行升…

Linux下编辑器vi/vim的使用介绍

vi编辑器是所有Unix及Linux系统下标准的编辑器。对Unix及Linux系统的任何版本,vi编辑器是完全相同的。 基本上vi可以分为三种状态,分别是命令模式(commandmode)、插入模式(insert mode)和底行模式(last line mode),各模式的功能为&#xff1…

Clojure程序设计

《Clojure程序设计》基本信息作者: (美)Stuart Halloway Aaron Bedra [作译者介绍]出版社:人民邮电出版社ISBN:9787115308474上架时间:2013-3-1出版日期:2013 年3月开本:16开页码:230版次&#…

重磅!AI Top 30+案例评选正式启动

2019 年,人工智能应用落地的重要性正在逐步得到验证,这是关乎企业生死攸关的一环。科技巨头、AI 独角兽还有起于草莽的创业公司在各领域进行着一场多方角斗。进行平台布局的科技巨头们,正在加快承载企业部署 AI 应用的步伐,曾经无…

直播回顾 | 关于Apollo 5.0控制在环仿真技术的分享

Apollo 用于模型验证和测试的基于 Web 的仿真平台 Dreamland 已经更新到能使用更强大的场景编辑器和环控制模拟。基于 Apollo 流水线和机器学习的动力学模型,复杂度较高,同时基于 AI 的全景数据建模,模型精细度高,误差比传统方式可…

eclipes 安装 pytdev,svn,插件

1, python pydevhttp://pydev.org/updates2, svnhttp://subclipse.tigris.org/update3, 推荐http://subclipse.tigris.org/update_1.10.x 转载于:https://blog.51cto.com/swq499809608/1240873

FFmpeg简介及在vc2010下编译步骤

FFmpeg是一个开源的多媒体库,最新版本是2.4.3,它的License是LGPL或GPL。FFmpeg可以用来记录、转换数字音频、视频,并能将其转换为流的开源计算机程序。它包括了音/视频编码库libavcodec。FFmpeg是在Linux下开发出来的,但它可以在包…

医院六级电子病历建设思路及要点

产生背景 在医院电子病历信息化发展的过程中,先后经历了纸质病历、电子病历、结构化电子病历以及具有全医疗过程管理能力的电子病历四个阶段。临床业务需求质量的逐步提升,标准规范的逐步细化,互联网战略的落地实施,无疑对目前电子…

上手必备!不可错过的TensorFlow、PyTorch和Keras样例资源

作者 | 黄海广来源 | 机器学习初学者(ID: ai-start-com)TensorFlow、Keras和PyTorch是目前深度学习的主要框架,也是入门深度学习必须掌握的三大框架,但是官方文档相对内容较多,初学者往往无从下手。本人从github里搜到…

Linux下gdb调试工具的使用

gdb是GNU开源组织发布的一个强大的Linux下的程序调试工具。 gdb主要完成四个方面的功能:(1)、启动你的程序,可以按照你的自定义的要求随心所欲的运行程序;(2)、可让被调试的程序在你所指定的调试的断点处停住(断点可以是条件表达式)&#xf…

UESTC 1726 整数划分(母函数)

题目链接&#xff1a;http://222.197.181.5/problem.php?pid1726 题意&#xff1a;求n的划分数。一种划分方案中不能有相同的数字。 思路&#xff1a;(1x)(1x^2)(1x^3)……(1x^1000). int f[N];void init() {f[1]1;int a[N]{0};a[0]1; a[1]1;int i,j;for(i2;i<1000;i){for(…

JS nodeType返回类型

JS nodeType返回类型 前几天朋友正好问道 这个 js的nodeType是个什么概念&#xff08;做浏览器底层的&#xff09;正好遇到这篇文章可以向大家解释下 将HTML DOM中几个容易常用的属性做下记录&#xff1a; nodeName、nodeValue 以及 nodeType 包含有关于节点的信息。 nodeName …

C# 获取指定目录下所有文件信息、移动目录、拷贝目录

/// <summary>/// 返回指定目录下的所有文件信息/// </summary>/// <param name"strDirectory"></param>/// <returns></returns>public List<FileInfo> GetAllFilesInDirectory(string strDirectory){List<FileInfo&g…

文件夹浏览(SHBrowseForFolder)

from http://www.cnblogs.com/Clingingboy/archive/2011/04/16/2018284.html 一.首先要为SHBrowseForFolder准备一个结构体BROWSEINFO typedef struct _browseinfoW {HWND hwndOwner;PCIDLIST_ABSOLUTE pidlRoot;LPWSTR pszDisplayName; // Return display…

技术新贵:RPA与NLP技术的结合与应用

什么是 RPA&#xff08;Robotic Process Automation&#xff09;&#xff1f;机器人流程自动化&#xff08;RPA&#xff09;是一种自动化工具&#xff0c;用于创建软件机器人的虚拟劳动力&#xff0c;从而优化和降低企业中端到端业务流程的成本。RPA 可以翻译成机器人流程自动化…

API Sanity Checker在Ubuntu中的使用

API Sanity Checker是一个自动生成单元测试用例的工具&#xff0c;可用于链接测试。它可用于三大桌面平台&#xff0c;下面简单介绍它在Linux下的使用步骤&#xff1a;1. 从http://ispras.linuxbase.org/index.php/API_Sanity_Autotest 下载最新的api-sanity-checker-1.98…

手动脱壳—dump与重建输入表(转)

文章中用到的demo下载地址&#xff1a; http://download.csdn.net/detail/ccnyou/4540254 附件中包含demo以及文章word原稿 用到工具: Ollydbg LordPE ImportREC 这些工具请自行下载准备 Dump原理这里也不多做描述&#xff0c;想要了解google it&#xff01;常见的dump软件有Lo…

如何用RNN生成莎士比亚风格的句子?(文末赠书)

作者 | 李理&#xff0c;环信人工智能研发中心vp&#xff0c;十多年自然语言处理和人工智能研发经验。主持研发过多款智能硬件的问答和对话系统&#xff0c;负责环信中文语义分析开放平台和环信智能机器人的设计与研发。来源 | 《深度学习理论与实战&#xff1a;基础篇》基本概…