当前位置: 首页 > 编程日记 > 正文

从ACM班、百度到亚马逊,深度学习大牛李沐的开挂人生

640?wx_fmt=jpeg

 

“大神”,是很多人对李沐的印象。作为一经推出便大受追捧的 MXNet 深度学习框架的主要贡献者之一,李沐功不可没。值得注意的是,这个由 DMLC(Distributed Machine Learning Community)打造的深度学习框架,创建者都是中国人,以陈天奇、李沐等为代表。现在,包括 AWS 在内的很多企业都将 MXNet 作为主流支持框架。

 

作为深度学习“大神”,李沐的开挂人生经历并不被所有人熟知。为了加深大家对李沐的了解,我们对其学习、职业和研究生涯做了一个简单的总结。


ACM班、百度、CMU、亚马逊,李沐的传奇人生

       640?wx_fmt=png      

 

以倒叙时间线来看,李沐目前为止的职业和学习生涯大致是这样的:

 

  • 亚马逊首席科学家,2017 年 3 月至今

  • 百度首席架构师,2014.4-2015.12

  • CMU 读博士,2012-2017

  • Google Research 实习生,2013 年夏

  • 百度高级研究员, 2011.4 - 2012.8

  • 香港科技大学研究助理,2009 - 2010

  • 微软亚洲研究院实习,2007 年夏

  • 上交 ACM 班


现状:在亚马逊发光发热


按照李沐的领英个人页面介绍,他在亚马逊的工作职责主要有:领导 AWS AI 科学团队,使深度学习易于使用,包括

 

  1. 使用动手笔记本教授深度学习:https://d2l.ai

  2. 使CV / NLP / GNN更容易:https://gluon-cv.mxnet.io,https://gluon-nlp.mxnet.io,https://dgl.ai


减少深度学习的机器成本:

 

  1. DL框架:https://.mxnet.io

  2. DL编译器:https://tvm.ai


这其中提到的教授深度学习笔记,就是李沐在 2019 年 1 月在 UC 伯克利上线的深度学习入门课程 Introduction to Deep Learning。同授这门课程的还有李沐的亚马逊同事 Alex Smola。课程内容大致是按照李沐老师的开源新书《动手学深度学习》来安排的。

 

课程主页:http://courses.d2l.ai/berkeley-stat-157/index.html

 

GitHub:https://github.com/d2l-ai/berkeley-stat-157

 

2017 年,李沐在其个人微博上总结了这一年他所在的亚马逊人工智能部门的两大重点工作:更灵活的前端 Gluon 和更可拓展的后端 NNVM compiler。

 

其实早在 CVPR 2017 上,李沐就提出了 MXNet 的重要新接口 Gluon,还撰文介绍MXNet/Gluon 的教程:https://github.com/mli/cvpr17

 

随后,在 2017 年 10 月,亚马逊 AWS 和微软共同宣布推出深度学习库 Gluon。Gluon 为各种水平的深度学习开发人员设计,帮助开发者在云端、App 和其他设备上设计原型,创建、训练和部署复杂的深度学习模型。目前,Gluon 已经与深度学习引擎 Apache MXNet 合作,并已支持另一个深度学习引擎——微软认知工具包(CNTK)。

 

2017 年 10 月 7 日,亚马逊和华盛顿大学合作发布了开源的端到端深度学习编译器 NNVM compiler。NNVM 是华盛顿大学博士陈天奇等人 2016 年发布的模块化深度学习系统,2017 年 8 月中旬,他们又推出了将深度学习工作负载部署到硬件的端到端 IR 堆栈 TVM,支持将包括 MXNet、Pytorch、Caffe2、CoreML 等在内的深度学习模型编译部署到硬件上并提供多级别联合优化,使得速度更快,部署更加轻量级。NNVM compiler 对 CoreML 的支持,让开发者可以在非 iOS 设备上部署 CoreML 模型。


自带光环的过去


说完了李沐大神的现状,现在我们来简单回顾下他带有传奇色彩的人生经历。

 

ACM 班“沐哥”

 

2004 年,李沐从上海交通大学计算机系 ACM 班毕业,在学校人留下“沐哥”的传说。在同期同学的眼中,李沐作为 ACM 班的典型代表,是个颇有领袖气质的人,以至于自然而然地获得一个“沐哥”的称号。他还是一个德智体美劳全面发展优秀学生,从专业课到个人大学四六级考试成绩都名列前茅,且兴趣广泛。在上海交通大学,他又度过了四年硕士生涯。

 

在后,2011 年 4 月-2012 年 8 月,他在百度担任高级研究员,创建了一套分布式机器学习广告系统。同年,在接到 CMU 的 offer 之后,他决定赴美深造。在李沐于 2017 年发布的文章《博士这五年》中,他提及了这段经历。

 

2011 年,李沐收到 CMU 的offer,在当时还在百度的余凯和张潼的引荐下,李沐决定辞职离开百度,开启 CMU 博士生涯。

 

CMU 师从 Alex Smola 和 Dave Andersen

 

在 CMU,李沐师从机器学习大师 Alex Smola 和 分布式系统教授  Dave Andersen,在两个导师的辅导下,李沐迅速成长。

 

此后,李沐加入了余凯的百度“少帅计划”,他选择了与相熟的陈天奇一起,把 CXXNet 作为起点,开始做深度学习相关项目。

 

创建 MXNet

 

此后,在陈天奇写 xgboost 的分布式启动脚本时,他们发现很多基础部件例如启动脚本,文件读取应该是可以多个项目共同使用,而不是每个项目都造一个轮子,于是李沐与陈天奇在 Github 上创建了一个叫 DMLC 的组织,用来加强合作和沟通。也就是这个组织,此后创建了全世界最受欢迎的深度学习框架之一——MXNet。

 

MXNet 创建的背后,还有一段小故事:当时 CXXNet 其实已经达到了一定的成熟度,但它的灵活性有局限性,用户只能通过一个配置项来定义模型,而不是交互式的编程。此时,李沐同时还参与另外一个项目 Minerva(张峥起头,王敏捷带领),这是一个类似 numpy 的交互式编程接口,但这个灵活的接口对稳定性和性能优化带来很多挑战。同时给两个项目做分布式扩展的李沐很自然地想到,也许可以把两个项目合并起来,取长补短。

 

在召集了两个项目的开发人员讨论了几次之后,新项目就此诞生,并被命名为 MXNet,意为 mixed-net,即 Minerva 和 CXXNet 的组合。

 

当时,李沐同时在做 difacto 和 MXNet 两个项目,在同吴恩达的一次见面之后,李沐听从了他的建议,把全部精力放在了 MXNet。这样,在谷歌 Jeff Dean 牵头创建的 TensorFlow 开源压力之下,MXNet 专注于自己的所长,才有了后面的大获成功。

 

《动手学深度学习》热卖

 

最后再提一点,《动手学深度学习》这本由李沐,美国伊利诺伊大学香槟分校计算机科学博士 Aston Zhang,李沐在 CMU 的导师 Alex Smola ,以及来自社区的 100 多位贡献者合著的深度学习书籍,推出之后便大受欢迎,曾在 6 月份登上京东 24 小时热销榜 Top 1。

       640?wx_fmt=png       

目前,这本书的交互式版本已推出了在线预览版,面向在校学生、工程师和研究人员,旨在帮助读者从入门到深入、动手学习深度学习,即使是零基础的读者也完全适用。

 

  • 在线书地址https://zh.gluon.ai/toc.html

  • GitHub 项目https://github.com/diveintodeeplearning/d2l-zh

  • PDFhttps://zh.gluon.ai/gluon_tutorials_zh.pdf


好消息!李沐亲授「深度学习实训营」


这里,我们要告诉大家一个好消息,那就是 AI ProCon 2019 邀请到了亚马逊首席科学家@李沐,在大会的前一天(9.5)亲授「深度学习实训营」,通过动手实操,帮助开发者一站式掌握 AI 核心技术,迅速上手深度学习应用。

 

640?wx_fmt=png 

除了深度学习「实训营」,李沐还将在第二天(9 月 6 日)作为 AI开发者大会(AI ProCon )的 Keynote 嘉宾,分享他对人工智能领域技术发展与行业应用的洞见。

 

2019 AI开发者大会(AI ProCon),我们集结了国内外来自阿里、华为、Google Brain、Amazon、微软中国、百度、京东、小米、快手、科大讯飞、商汤、旷视、图森、云知声、思必驰等60+ 技术大咖,在 Keynote 和机器学习、计算机视觉、自然语言处理、知识图谱、推荐系统、5G 驱动 AIoT、AI 开源、AI+小程序、AI+DevOps 9 大技术论坛上分享硬核 AI 技术,深剖行业痛点,助力开发者职业发展!

 

更多嘉宾正在确认之中......(最终出席嘉宾以现场为准)

 

丰富的机器学习相关话题和问题讨论,相信会带给观众全新的想法与思考。还在等什么?迅速行动起来,到现场感受人工智能领域产学研大神、顶尖开发者汇聚一堂的热烈气氛,与大神一起头脑风暴,刷新你对 AI 技术的认知!

        640?wx_fmt=jpeg        

特惠票价限时抢购中,扫码或点击阅读原文,了解更多嘉宾和大会信息。

相关文章:

Linux基础介绍

Linux的创始人Linus Torvalds。Linux的官方标准发音为[linəks]。Linux和Unix是非常像的,Linux就是根据Unix演变过来的。Linux是免费的,其实只是说Linux的内核免费。在Linux内核的基础上产生了众多的Linux版本。Linux的发行版说简单点就是将Linux内核与应…

Go在区块链的发展和演进

Go语言发展至今已经过去十年多了,是目前最流行的新兴语言,云计算领域的首选语言,而且目前随着区块链的流行,Go再次成为了这个领域的第一语言,以太坊,IBM的fabric等重量级的区块链项目都是基于Go开发。 原文…

一天掌握AI核心技术,上手应用,开发者该划哪些重点?

Alpha Go 只会下棋,却并不擅长垃圾分类;智能助手已经可以执行很多任务,但距离真正的人机自然交互还很远。如今 AI 的发展面临着诸多瓶颈,基础理论研究缺失,深度学习的黑箱属性无解,把一切托付于未知并不可靠…

学会这21条,你离Vim大神就不远了

来源 | Python编程时光(ID: Python-Time)导语:作者本人是 Vim 的重度使用者,就因为喜欢上这种双手不离键盘就可以操控一切的feel,Vim 可以让人对文本的操作更加精准、高效。对于未使用过 Vim 的朋友来说,可…

C 语言 和 C++语言的对比学习   二 数据类型

不管是什么语言,我们最习惯的是通过 “hello world” ,来昭告世界,我们有了新的语言来向这个世界问好,尽管真正属于我们自己的其实是哭声。(呵呵,笑点有点低),下面我们来介绍最为基础…

Makefile语法基础介绍

在Linux下,make是一个命令工具,是一个解释Makefile中指令的命令工具。make命令执行时,需要一个Makefile文件,以告诉make命令需要怎么样去编译和链接程序。 make如何工作:在默认的方式下,只输入make命令&am…

MaxCompute studio与权限那些事儿

背景知识 MaxCompute拥有一套强大的安全体系,来保护项目空间里的数据安全。用户在使用MaxCompute时,应理解权限的一些基本概念: 权限可分解为三要素,即主体(用户账号或角色),客体(表…

GitHub标星3w+的项目,全面了解算法和数据结构知识

作者 | 程序员小吴来源 | 五分钟学算法(ID: CXYxiaowu)导语:今天分享一个开源项目,里面汇总了程序员技术面试时需要了解的算法和数据结构知识,并且还提供了相应的代码,目前 GitHub 上标星 35000 star&#…

Shell脚本基础介绍

shell基础简介:编写脚本通常使用某种基于解释器的编程语言。而shell脚本不过就是一些文件,我们能将一系列需要执行的命令写入其中,然后通过shell来执行这些脚本。进入Linux系统(Ubuntu),打开终端Terminal,”$”表示普通…

「小程序JAVA实战」小程序的举报功能开发(68)

转自:https://idig8.com/2018/09/25/xiaochengxujavashizhanxiaochengxudeweixinapicaidancaozuo66-2/ 通过点击举报按钮,跳转到举报页面完成举报操作。 后台开发 获取发布人的userId,videoId,创建者的Id controllerUserControlle…

tar常见文件解压法

2019独角兽企业重金招聘Python工程师标准>>> tar常见文件解压法:.gz - z 小写.bz2 - j 小写.xz - J 大写.Z - Z大写 转载于:https://my.oschina.net/open1900/blog/149238

cookie的作用域

当我们给网站设置cookie时,大家有没有发现在网站的其他域名下也接收到了这些cookie。这些没用的cookie看似不占多少流量,但如果对一个日PV千万的站点来说,那浪费的资源就不是一点点了。因此在设置cookie时,对它的作用域一定要设置…

必看,10篇定义计算机视觉未来的论文

译者 | Major编辑 | 赵雪出品 | AI科技大本营(ID:rgznai100)导语:如果你没能参加 CVPR 2019 , 别担心。本文列出了会上人们最为关注的 10 篇论文,覆盖了 DeepFakes(人脸转换), Facial Recogniti…

有效的rtsp流媒体测试地址汇总

以下是从网上搜集的一些有效的rtsp流媒体测试地址: 1. rtsp://218.204.223.237:554/live/1/0547424F573B085C/gsfp90ef4k0a6iap.sdp 2. rtsp://218.204.223.237:554/live/1/66251FC11353191F/e7ooqwcfbqjoo80j.sdp 3. rtsp://211.139.194.251:554…

java简单的ID生成器

2019独角兽企业重金招聘Python工程师标准>>> https://www.cnblogs.com/hongdada/p/9324473.html https://github.com/apache/incubator-shardingsphere 转载于:https://my.oschina.net/u/3005325/blog/3006311

安装、设置与启动MySql5.1.30绿色版的方法

1、解压 mysql-noinstall-5.1.30-win32.zip(下载地址http://dev.mysql.com/downloads/mysql/5.1.html)2、在 F 盘建立目录 MySql\MySqlServer5.1\ 3、把解压的内容复制到 F:\MySql\MySqlServer5.1\4、在 F:\MySql\MySqlServer5.1\ 中找 my-large.ini 把它复制成 my.ini5、在…

网页中插入VLC播放器播放rtsp视频流步骤

1. 仿照http://download.csdn.net/detail/haowenxin123456789/8044245 中步骤; 2. 从http://www.videolan.org/vlc/index.html 中下载 vlc-2.2.1-win32.exe 并安装到D:\\ProgramFiles文件夹下; 3. 运行:regsvr32 D:\\ProgramFil…

@程序员,“10倍工程师”都在追这四大AI风向

技术的发展,驱动着产业变革,从而改变着我们的生活方式。当5GAI 时代来临,核心的技术生产力就是开发者:开发者研究前沿的科学创新,推动技术发展,将技术应用于实际场景中。开发者是企业实现商业价值必不可少的…

End Credits

我不知道怎么把他删掉... 今晚WC文艺汇演wwww(等待唱歌.jpg 要是能截到屏一定发上来qwqqqqq 话说这首曲子是新发现的QAQ(Xeuphoria的还是那么好听qwqqq 今天学了快读qvq 还有...dpwww P2015 二叉苹果树 有一棵苹果树,如果树枝有分叉,一定是分2叉&#xf…

三十六亿的《哪吒》历时五年,如何用AI解决动画创作难题?

作者 | 神经小姐姐来源 | HyperAI超神经( ID: HyperAI )【导读】《哪吒之魔童降世》自 7 月 26 日上映以来,好评如潮,票房一路高歌猛进,目前已突破 36 亿。这款火爆的动画背后,是主创团队历时 5 年的细致打磨。而这漫长…

vb.net结构化异常处理和“邪用”

vb.net中的错误处理包括两种:非结构化异常处理技术和结构化异常处理。非结构化异常处理技术在vb 6.0中使用的比较普遍,即通过Err对象和ON Error、Go To、Resume等语句来实现。这种方式可以跟踪最近产生的异常和最近异常处理程序的位置。而结构化异常处理…

Ubuntu 14.04 64位机上不带CUDA支持的Caffe配置编译操作过程

Caffe是一个高效的深度学习框架。它既可以在CPU上执行也可以在GPU上执行。下面介绍在Ubuntu上不带CUDA的Caffe配置编译过程: 1. 安装BLAS:$ sudo apt-get install libatlas-base-dev 2. 安装依赖项:$ sudo apt-get install libprot…

NAT环境无法访问云端的深层次分析

这是一次我维护runningdoctor时候遇到的问题现象:1.用户无法打开web.runningdoctor.cn 2.监控状态无异常、无报警 3.tracert结果无异常、丢包率正常 4.用户无法访问的时候,我们能打开网站 5.多地代理访问网站,结果正常 6.有打开网站特别慢的时…

Magento(麦进斗)安装问题

安装到数据库那一步会跳出 lib\Zend\Db\Statement\Pdo.php on line 228 错误 解决方案: 在你的php模块里的php.ini文件添加(或者修改)max_execution_time1800 重启你的web服务器(apache,nginx),…

Linux Socket基础介绍

Linux Socket函数库是从Berkeley大学开发的BSD UNIX系统中移植过来的。BSD Socket接口是众多Unix系统中被广泛支持的TCP/IP通信接口,Linux下的Socket程序设计,除了微小的差别之外,也适用于大多数其它Unix系统。 Socket接口是TCP/IP网络的API…

免费公开课 | 基于定制数据流技术的AI计算加速

随着人工智能时代的来临,业内对于更高效率算力的需求也越来越紧迫,而传统的 CPU 计算能力弱,只适合软件编程,并不适合应用于人工神经网络算法的自主迭代运算。为了满足支撑深度学习的大规模并行计算的需求,人工智能芯片…

代替国足踢决赛?马宁当选卡日大战第四官员

卡塔尔杀进亚洲杯决赛。 图片来源:Osports全体育图片社 中新网1月30日电 日本与卡塔尔将会师本届亚洲杯的决赛。北京时间30日,亚足联官方已经公布了本次决赛的裁判组,中国裁判员马宁将担任第四官员。 来自乌兹别克斯坦的亚洲金哨伊尔马托夫将…

AI规模化落地,英特尔至强的七重助力

当今时代,各行各业与人工智能(AI)加速融合,通过智能化创新来寻求业务转型升级。与为数不多的顶级AI研发公司相比,大多数传统行业或企业有着更丰富的 AI 应用场景,推动着规模化的AI应用落地,其AI…

Linux进程编程基础介绍

Linux系统是一个多进程的系统,它的进程之间具有并行性、互不干扰等特点。也就是说,每个进程都是一个独立的运行单位,拥有各自的权利和责任。其中,各个进程都运行在独立的虚拟地址空间,因此,即使一个进程发生…

关于互联网技术基层绩效管理的一些思考

起因是一篇内部的文章,那记录也就留在内部吧,磨炼了的价值观在自己心里就好。 类似的还有 1. 罗振宇不发年终奖:https://xueqiu.com/7118120763/119669075 2. 有赞白鸦强行一波996:https://baijiahao.baidu.com/s?id1623959680…