当前位置: 首页 > 编程日记 > 正文

最新剑桥《AI全景报告》出炉:中国发表机器学习学术研究超过美国

640?wx_fmt=jpeg


来源 | 转载自新智元(ID:AI_era


2019年即将过去一半,剑桥大学的两位研究人员近日推出了本年度的State AI 2019全景报告。


本报告基本沿袭去年的大体框架,从产业、人才、政策、预测等方面对过去一年来AI领域的技术的新进步、产业格局的新变化、政府政策的新特点等方面进行了总结,并作出关于未来的预测。


640?wx_fmt=png


报告地址:

https://www.slideshare.net/StateofAIReport/state-of-ai-report-2019-151804430 


值得一提的是,与去年不同的是,2019年的报告为中国单列一章,介绍中国AI技术在日常消费、机器人、半导体等领域的进步。


640?wx_fmt=jpeg


本文重点对报告中的 AI 研究、AI 人才以及中国三部分内容作出介绍。


强化学习开疆扩土:在多项竞技性游戏中击败人类


640?wx_fmt=jpeg


目前已经被AI统治的游戏包括《蒙特祖玛的复仇》、《星际争霸2》、《雷神之锤3》,在DOTA2上游戏水平实现大幅进步。未来的游戏AI可能让人类更加遥不可及了。


640?wx_fmt=jpeg


未来,研究人员有望利用强化学习训练单个机器人来完成多个复杂任务,无需针对每个任务进行专门的再学习。


640?wx_fmt=jpeg


基于好奇心机制的探索:在奖励稀疏或无奖励机制的条件下,智能体可以依赖

“好奇心”解决问题。


640?wx_fmt=jpeg


面向在线计划学习动态模型:模型可从图像中快速学习环境动态信息,准确预测数个时间段后的奖励。


640?wx_fmt=jpeg


研究成果逐步进入实际生产环境:在众多机器学习框架和工具的支持下,Facebook发布的开源端对端平台Horizon,推进大规模生产环境下的系统优化,如信息联想、视频流质量、通知服务优化等。


640?wx_fmt=jpeg


生命科学中的新突破:AlphaFold精准预测蛋白质的折叠结构


640?wx_fmt=jpeg


NLP大丰收:预训练语言模型大展身手


新的预训练模型不断涌现,各大数据集新纪录常看常新。Google AI的BERT, 、Transformer,艾伦研究所的ELMo、OpenAI的Transformer、 Ruder和Howard的 ULMFiT、微软的MT-DNN等争奇斗艳。


640?wx_fmt=jpeg


3 神经机器翻译:无需双向文本


640?wx_fmt=jpeg


4 自然语言模型学会常识推理


640?wx_fmt=jpeg


5 对机器学习领域的数据隐私和保护越来越重视


640?wx_fmt=jpeg


医学领域大展身手,诊断堪比人类专家


诊断眼疾


640?wx_fmt=jpeg


使用两个阶段机器学习方法,AI模型给出了专家级的眼疾诊断和治疗参考建议


利用心电图检测心律不齐,达到人类医生水平


640?wx_fmt=jpeg


8 超过60万的X光片数据集已经被分享出来,但远远不够


640?wx_fmt=jpeg


用于成像诊断的深度学习模型可以很好地拟合数据集,但是它们难以推广到新的数据分布。尽管改进了这个新数据集的文档,但标签定义很浅

使用医生笔记中的NLP提取标签存在挑战:容易出错且容易受到影响。放射学报告中包含的信息不足,大多数标签类别的错误率为5-15%

大量重复扫描,其中70%的扫描来自30%的患者。这减少了数据集的有效大小及其多样性,影响训练模型的普适性


9 研究人员从听觉皮层的神经活动中重建语音


640?wx_fmt=jpeg

哥伦比亚大学的研究人员使用侵入性脑电图来测量5名接受癫痫治疗的患者在连续收听语音时的神经活动。


反过来使研究人员能够通过大脑活动的声码器合成语音。通过声码器测试单个数字“口语”时,系统的准确度达到75%。与基线线性回归方法相比,深度方法将语音的可懂度提高了65%。


该研究表明,大脑计算机界面有可能恢复瘫痪患者的沟通


10 使用蒙特卡罗树搜索神经网络通过训练1240万个反应来解决逆向合成


一个由三个NN(3N-MCTS)构建的系统:

  • 通过提出有限数量的自动提取转换来指导向有希望的方向搜索

  • 预测拟议的反应是否实际可行

  • 估计位置值并迭代


640?wx_fmt=jpeg


这种方法比最先进的计算机辅助综合计划快得多。实际上,3N-MCTS解决了超过80%的分子测试集,每个目标分子的时间限制为5秒。


相比之下,一种称为最佳第一搜索的方法,其中通过神经网络学习函数可以解决40%的测试集。使用手动编码启发式功能设计的最佳首次搜索执行最差:它在5秒内解决了0%。


11 AutoML:神经网络架构和超参数的进化算法


共同优化超参数,最大化网络性能,同时最小化复杂性和大小


640?wx_fmt=jpeg

之前的AutoML工作使用RL单独优化超参数或网络架构。遗憾的是,RL系统要求用户事先为算法定义适当的搜索空间以用作起点,可以针对每个层优化的超参数的数量也是有限的。


此外,计算非常繁重。为了生成最终的最佳网络,必须对数千个候选架构进行评估和训练,这需要大约100k GPU小时。


另一种选择(Learning Evolutionary AI Framework:LEAF)是使用进化算法进行超参数和网络架构优化,最终产生更小,更有效的网络

例如,LEAF与手工制作的数据集特定网络(CheXNet)的性能相匹配,用于胸部X射线诊断分类,并且优于Google的AutoML。


12 AutoML:神经网络架构和超参数的进化算法


基于CNN的自动化架构搜索的步伐正在加快:Facebook与谷歌的竞争加剧。


640?wx_fmt=jpeg


谷歌展示了一种基于RL的多目标方法(MnasNet),可以在Google Pixel平台上测量具有低实际推理延迟的高精度CNN模型。该系统在Pixel手机上达到74.0%的Top-1精度,延迟为76ms,比MobileNetV2快1.5倍。


Facebook提出了一种可区分的神经架构搜索(DNAS)框架,该框架使用基于梯度的方法在分层搜索空间上优化CNN架构。FBNet-B实现了与MnasNet相同的Top-1精度,但延迟仅为23.1ms,搜索成本降低了420倍


13 GAN的最新技术水平在不断发展:从颗粒到GANgsta


较大的模型和大批量训练进一步提高了使用GAN生成的图像的质量。


640?wx_fmt=jpeg


14 GAN中的最新技术水平在不断发展:从面部到全身


通过将面部与口语相匹配(左),电影只需设置一次,即可以不同语言生成相同的视频。下一步是从头到脚生成整个身体,目前用于零售目的(右)。


640?wx_fmt=jpeg


15 在图像和视频操作之后出现逼真的语音合成


640?wx_fmt=jpeg


16 从单个图像中学习对象的3D形状


模型输出10个不同类别(如汽车、摩托车、行人、交通锥等)的3D边界框,类特定属性(如汽车是否正在行驶或停车)并提供当前速度矢量。


640?wx_fmt=jpeg


17 AI人才:五大国雇佣了72% 专家,论文引用率只有中国增长


640?wx_fmt=jpeg


人才方面,以研究论文的产出衡量,谷歌是最具生产力的一个组织。上图为在人工智能顶会NeurIPS 2018上,谷歌发表的论文最多,其次是MIT、斯坦福、CMU和加州大学伯克利分校。


640?wx_fmt=jpeg

在NeurIPS、ICML或ICLR上发表论文的4000名研究人员中,88%是男性。


640?wx_fmt=jpeg


大型科技公司高级工程师的年薪接近100万美元。


640?wx_fmt=jpeg


另一方面,数据标签工作也有了巨大的增长,尤其是在中国。这类工作的最低工资可低至每小时10元人民币。


640?wx_fmt=jpeg


神经网络的先驱、Yann LeCun、Geoffrey Hinton和Yoshua Bengio获得了图灵奖,这是计算机科学的最高奖项。


640?wx_fmt=jpeg


欧洲发表的AI论文最多,但在平均引文率这个指标上,只有中国是增长的。

该领域论文的数量整体是增长的,不同地区论文的平均被引量表明,只有来自中国的论文变得更有影响力了。美国作者发表的论文被引用的次数比全球平均水平高出83%。


640?wx_fmt=jpeg


MIT在计算与人工智能领域新增10亿美元投资。在3.5亿美元捐赠的支持下,MIT新的计算学院将把MIT重新定位为向所有研究领域注入AI教育,提供了50个新的教职,使MIT在该领域的学术能力翻了一番。


640?wx_fmt=jpeg


大学里人工智能相关课程的注册人数也在增长,中国的增长尤其快。


与2012年相比,清华大学和斯坦福大学的人工智能课程注册人数分别增加了近16倍和5倍。


640?wx_fmt=jpeg


但人工智能课程中教授和学生的性别多样性仍远未达到平等。平均而言,80%教AI的教授是男性,75%的学AI的本科生是男生。


640?wx_fmt=jpeg


这造成的一个结果是,在美国,申请AI方面职位的人中71%是男性。


640?wx_fmt=jpeg


Element.AI 2019年进行的一项AI人才调查显示:

  • 对22400名个人作者在21个机器学习会议上发表的论文进行调查:只有19%的学术作者和16%的行业作者是女性。

  • 44%的作者在美国获得博士学位,11%来自中国,6%来自英国。

  • 五大国家——美国、中国、英国、德国和加拿大——雇佣了72%的作者。图上的圆圈表示每个国家在会议上发表论文的研究人员数量。


640?wx_fmt=jpeg


同样是Element.AI,从AI人才流入和流出来看,加拿大、英国和瑞士都是“平台国家”,既吸引外国人才,又输出本土培养的人才。美国和中国的生态系统更为成熟——流入和流出都较低。


但雇佣AI研究人员进入公司的趋势似乎正在放缓。据称,科技巨头冻结或减少了对AI研究人才的招聘。这可能是一个迹象,表明企业现在需要人才来将应用研究投入生产。


18 人工智能技术已经渗入中国企业


人脸识别已经成为日常消费付款方式。


640?wx_fmt=jpeg


养鸡业:2016年,京东推出了一项“小鸡快跑(running chicken)”计划,帮助中国农业地区减少贫困。根据该计划,该公司将购买任何自由放养的鸡肉,只要其步数超过100万步,且价格是当前市场价格的三倍。现在,京东已经扩展了该项目,将人工智能工具整合到畜牧工作流程中。这包括自动喂食、浇水和清除废物。人工智能系统还将监测和识别鸡的食物摄入量、排便情况和其他生理状况,如发病情况。如果一只鸡生病了,专家会在网上提供医疗服务和处方药物。


养猪业:在Dekon集团、特区集团和阿里巴巴云的合作中,计算机视觉和语音识别系统被用来通过纹在猪腹部的数字来识别个体猪,还可以监测小猪发出的痛苦叫声。到2020年,Dekon计划每年饲养1000万头猪。

蟑螂养殖:好医生集团在四川省每年生产60万只蟑螂。他们利用人工智能系统收集和分析多达80种蟑螂的特征,如湿度、温度和食物需求,这些特征可以刺激蟑螂的生长和繁殖速度。


中国企业的研发支出增长迅速但显著落后于市场份额。美国企业仍占全球科技支出的61%。


640?wx_fmt=jpeg


中国半导体贸易逆差正(缓慢)上升。下图反映了中国半导体销售和采购的趋势。


640?wx_fmt=jpeg


在过去的三年里,一些中国的工业企业已经自动化了40%的劳动力。这可能部分归因于自2012年以来,中国每年的机器人安装数量增长了500%(欧洲为112%)。然而,目前尚不清楚AI软件在多大程度上在运行这些已安装的机器人或者是否有助于它们的发展。中国工业自动化水平不断提高,就业岗位不断流失。


640?wx_fmt=jpeg


京东上海配送中心每天使用自动化仓库机器人组织、挑选和运送20万份订单。这个设施由四名工人照管。京东的仓库数量和表面积同比增长45%。


640?wx_fmt=jpeg


2018年,有33家中国企业在美国上市,同比增长2倍,接近2010年的历史最高水平。


640?wx_fmt=jpeg


发明专利的审批过程充满挑战,一旦获得批准,将获得20年的保护。实用新型和外观设计专利都有10年的使用寿命,不需要经过严格的审查,可以在不到1年内授予。这种双重专利制度使中国在专利方面领先于其他国家。中国企业拥有的专利最多,但2017年“发明专利”仅占23%。


640?wx_fmt=jpeg


91%的5年设计专利(左)和61%的5年实用新型专利(右)被放弃。相比之下,美国5年历史专利的维护费占85.6%。


640?wx_fmt=jpeg


中国目前发布的对机器学习影响较大的学术研究现状。


640?wx_fmt=jpeg


中国发表的机器学习学术研究已经超过美国。艾伦研究所(Allen Institute)最近的一项分析显示,中国在质量方面的差距也在迅速缩小。


报告原文:

https://www.slideshare.net/StateofAIReport/state-of-ai-report-2019-151804430


(*本文为 AI科技大本营转载文章,转载请联系原作者)


精彩推荐



“只讲技术,拒绝空谈”2019 AI开发者大会将于9月6日-7日在北京举行,这一届AI开发者大会有哪些亮点?一线公司的大牛们都在关注什么?AI行业的风向是什么?2019 AI开发者大会,倾听大牛分享,聚焦技术实践,和万千开发者共成长。目前,大会早鸟票抢购中~扫码购票,领先一步!


640?wx_fmt=png


推荐阅读

  • Python传奇:30年崛起之路

  • 真实揭秘 90 后程序员婚恋现状,有点扎心!

  • 避坑指南:如何选择适当的预测评价指标?| 程序员评测

  • 53K!拿下阿里Python岗,这些技术点全考了!

  • 周杰伦根本不需要流量!

  • 在币圈, 如何玩转反间计?

  • SaaS前世今生:老树开新花

  • 华为 5G 折叠屏手机获入网许可;苹果召回部分 MacBook Pro;Oracle Linux 8.0 发布 | 极客头条

640?wx_fmt=png你点的每个“在看”,我都认真当成了喜欢

相关文章:

《OpenMP编译原理及实现技术》摘录

内容摘自《OpenMP编译原理及实现技术》第2章 代码测试环境:Windows7 64bit, VS2010, 4核机。 可以说OpenMP制导指令将C语言扩展为一个并行语言,但OpenMP本身不是一种独立的并行语言,而是为多处理器上编写并行程序而设计的、指导共享内存、多…

C# 36进制转10进制

代码是Java转过来的,变量名都没有改……有空再整理一下好了。public long toDecimal(string input, long bs){try{long Bigtemp 0, temp 1;int len input.Length;for (int i len - 1; i > 0; i--){if (i ! len - 1)temp * bs;long num changeDec(input[i]);…

Oracle Cloud Native Framework推出云原生解决方案

摘要:Oracle Cloud Native Framework云原生平台提供托管云服务和本地软件,同时在现Oracle云基础架构上跨应用程序配置和分析大量服务。developer relations for Oracle Cloud Infrastructure副总裁Bob Quillin讨论了该框架的优势以及对2019年云原生市场的…

OpenMP知识点汇总

1. OpenMP(Open Multi-Processing)官网:http://openmp.org/wp/ 2. OpenMP最新版本4.0,2013年7月发布。Visual Studio 2010内置支持OpenMP2.0,选中工程属性->C/C->Language->Open MP Support:选中Yes(/openmp)即可,然后在…

chsop 兼容jquery(解决与transport.js冲突)

2019独角兽企业重金招聘Python工程师标准>>> $(function() { window.__Object_toJSONString Object.prototype.toJSONString; delete Object.prototype.toJSONString; }); 要用到jquery的页面放入此代码即可 转载于:https://my.oschina.net/netmouse/blog/1241…

进程详细剖析(二)

摘自《C多核高级编程》 5.6.3 进程状态 在进程执行期间,它的状态会发生改变。进程的状态时指进程的当前状况。在POSIX兼容的环境中,进程可以处于以下状态: 1)运行(running) 2)就绪(runnable, r…

AI算力需求6年增长30万倍,「超异构计算」才能满足下一个10年

今年 3 月,「强化学习教父」Richard Sutton 在《苦涩的教训》一文中指出,「70 年的人工智能研究史告诉我们,利用计算能力的一般方法最终是最有效的方法。要在短期内有所提升,研究人员要利用专门领域的人类知识。但如果想要长期的获…

一览六月最热的5篇AI技术论文

作者 | 神经小姐姐转载自HyperAI超神经(ID: HyperAI)导语:始建于 1991 年的 arXiv.org 至今已收录超过 100 万篇论文预印本,近年来,其每月提交量已经超过 1 万篇。这里成为一个巨大的学习宝库。本文罗列了 arXiv.org 上…

OnCheckedChanged的触发需要AutoPostBack=true

OnCheckedChanged的触发需要AutoPostBack"true"

OpenCV中resize函数五种插值算法的实现过程

最新版OpenCV2.4.7中,cv::resize函数有五种插值算法:最近邻、双线性、双三次、基于像素区域关系、兰索斯插值。下面用for循环代替cv::resize函数来说明其详细的插值实现过程,其中部分代码摘自于cv::resize函数中的源代码。 每种插值算法的前…

企业金融云存储建设之路

当前世界形势千变万化,各种技术创新层出不穷,新兴业务模式也是波谲云诡,企业的信息化建设如何紧跟业务,适应业务乃至驱动业务转型是各级管理者的头等题目。对于底层执行者,如何能够快速满足企业的要求,如何…

【原创】VB利用堆栈实现算术表达式计算

这个抽象算法早已为人所知,只不过在VB的公开文档中鲜见示例代码。于是,为了提高自己的程序设计水平,锻炼自己的能力,我写了如下代码。 【VB代码版权所有,允许转载修改用作学习目的,转载必须注明来源】 【求…

树莓派4与英伟达Jetson Nano性能大比拼,谁是最佳的嵌入式“电脑”?

作者 | Chris Pietschmann译者 | 弯月,责编 | 屠敏转载自CSDN(ID:CSDNnews)导读:日前,Raspberry 基金会发布了开发者为之兴奋的 Raspberry Pi 4,其不仅在性能上进行了全面的升级,而且…

作为互联网流量入口,CDN日志大数据你该怎么玩?

CDN是非常重要的互联网基础设施,用户可以通过CDN,快速的访问网络中各种图片,视频等资源。在访问过程中,CDN会产生大量的日志数据,而随着如今越来越复杂的网络环境变化,和业务的迅速增长,日志数据…

OpenCV中图像旋转(warpAffine)算法的实现过程

在OpenCV中,目前并没有现成的函数直接用来实现图像旋转,它是用仿射变换函数cv::warpAffine来实现的,此函数目前支持4种插值算法,最近邻、双线性、双三次、兰索斯插值,如果传进去的参数为基于像素区域关系插值算法(INTE…

10亿美元续命!OpenAI获微软投资,意在通用人工智能?

来源 | OpenAI官博译者 | 孙薇编辑 | 一一出品 | AI科技大本营(ID:rgznai100) 7 月 22 日,微软宣布将对非营利人工智能研究组织 OpenAI 投资 10 亿美元,用于通用人工智能(AGI)的开发。双方将以微软原有的公…

TrayIcon 类 添加系统托盘不显示托盘图标

为什么80%的码农都做不了架构师?>>> 好久不碰 java swing最近写了一个swing 程序 添加托盘时,怎么也不显示图标,就一空白 ,在网上搜了老半天,大部无效。 边看帖子边看 java api ,结合理解,有一属性设置了一…

Crystal Report 加载模板报错 无法在c++ 堆栈中打开由jrc 引擎处理的文档

2019独角兽企业重金招聘Python工程师标准>>> 纠结了很久, 尝试过录入一个错误的路径,文件读取也是包相同的错误,也就是表示找不到路径文件而已,并不是开发环境的问题 于是设置一个最简单的路径,放置下去rpt模板,代码后续没有报错; 再次之前也修复了一个关于引用的dl…

Ubuntu下makefile及gcc生成静态库动态库的简单使用举例

环境:Ubuntu-13.10 32位(虚拟机)、gcc4.8.1 首先创建一个test_makefile_gcc文件夹,此test_makefile_gcc文件夹下包括:src文件夹用于存放源文件; include文件夹用于存放头文件;bin文件夹用于存放生成的动态库.so文件&…

Exchange Server 2013 安装完成后配置外部URL

Exchange Server 2013 安装完成后配置外部URL 比如 mail.contoso.com 1、转到 EAC → “服务器”,然后单击“配置外部访问域”。2、在“选择要与外部 URL 一起使用的客户端访问服务器”下面,单击“添加”3、选择您要配置的客户端访问服务器,…

Ubuntu下CodeBlocks的安装、配置及静态库动态库的简单使用举例

1、 从Ubuntu Software Center中搜索Code::Blocks并安装; 2、 在第一次启动时选择GNU GCC Compiler作为默认的编译器; 3、 生成静态库并调用操作步骤,代码同 http://blog.csdn.net/fengbingchun/article/details/17994489 3.1、New fil…

React 打怪笔记

介绍 本文为学习react中的记录。 Tips: 当组件的props或state有变化,执行render函数。无论是使用函数或是类来声明一个组件,它决不能修改它自己的propsReact 可以将多个setState() 调用合并成一个调用来提高性能。无状态函数式组件 (stateless functiona…

新闻智能分类练习赛开始报名啦!最先达到80分就可以领GPU,技术书籍!

现代信息爆炸般地产生,信息如海如潮。信息分类,不仅有利于加快信息检索速度,且有利于提高查准率。Internet是信息的重要载体,深入地研究与探讨网上信息自动分类的方法、技术和理论,已成为时代的迫切需求和新的研究热点…

项目经理应该具备的技能

作为一个优秀的项目经理应该具备五个方面的技能: 项目管理知识体系 应用领域的相关知识、标准和规则项目环境知识一般管理知识软技能/人际关系技能项目管理知识体系 就是要掌握常说的9大知识领域:范围、时间、成本、质量、人力资源、风险、沟通、采购再加上集成…

SSE2 Intrinsics各函数介绍

SIMD相关头文件包括&#xff1a; //#include <ivec.h>//MMX//#include <fvec.h>//SSE(also include ivec.h)//#include <dvec.h>//SSE2(also include fvec.h)#include <mmintrin.h> //MMX#include <xmmintrin.h> //SSE(include mmintrin.h)#incl…

中国城市道路名图鉴

作者| AlfredWu来源 | Alfred数据室&#xff08;ID&#xff1a;Alfred_Lab&#xff09;不知道大家出差或旅游的时候有没有发现&#xff0c;有些城市特别喜欢使用其它城市或者省份的名字作为道路名&#xff0c;特别是青岛市&#xff0c;这会儿还在徐州路&#xff0c;走过一个街区…

中国电子信息产业发展研究院主办的2018中国软件大会上大快搜索“又双叒叕”获奖了...

大快搜索自荣获“2018中国大数据企业50强”殊荣&#xff0c;12月20日在由工信部指导&#xff0c;中国电子信息产业化发展研究院主办的2018中国软件大会上&#xff0c;大快搜索获评“2018中国大数据基础软件领域领军企业”称号&#xff0c;入选中国数字化转型TOP100服务商&#…

SystemCenter2012SP1实践(15)共享库服务器和ISO

用过HyperV的同学都知道&#xff0c;HyperV调用ISO作为启动光盘的时候&#xff0c;必须保存在本地才行。网络共享下的一概不认。在SCVMM下&#xff0c;我们可以通过一些设置&#xff0c;让SCVMM下创建的虚拟机&#xff0c;支持调用不在同一台主机上的ISO文件。我是分隔线首先要…

XLNet:公平PK,BERT你已经被超过!

作者 | XLNet Team译者 | 孙薇责编 | Jane出品 | AI科技大本营&#xff08;ID: rgznai100&#xff09;【导语】几周前&#xff0c;XLNet 团队发布了新型预训练语言模型 XLNet&#xff0c;这个新模型在各项基准测试中都优于谷歌之前发布的BERT模型&#xff0c;其中模型 XLNet-La…

C/C++中switch用法的一种替换方式

在C/C中&#xff0c;switch语句是经常被用到的&#xff0c;当switch内的case语句较多时程序有时显得比较繁乱&#xff0c;此种情况下可以用另外一种实现方式替代switch。详细用法见例子&#xff1a; #include "stdafx.h"float AddFunc(float a, float b) {return (a …