数据依赖症:当今AI领域的核心风险
在最近结束的2017年度AI星际争霸竞赛上,Facebook做出了一款人工智能“CherryPi”,参与到这项旨在让各路AI技术在星际争霸游戏中同场竞技的赛事之中。
但很遗憾的是,Facebook仅仅获得了赛事的第六名,最直接的原因,在于Facebook坚持在CherryPi的研发中主要使用机器学习技术,而非像其他大多数参与者那样使用纯粹的预设编码脚本。预设编码脚本即通过人工方式预编程了非常复杂的游戏策略脚本,让程序根据脚本按图索骥机械式执行游戏。面对这些实际上并不能称为人工智能的对手,Facebook自家主要基于AI技术的CherryPi基本处于劣势,最终仅能获得第六名。随便提一下今年这项赛事的获胜者是一名对星际争霸游戏本身有深刻理解的业余人士所编制的脚本机器人。当然Facebook的失败并不意外,因为目前要纯粹靠人工智能去挑战携带了大量人类游戏先验知识的脚本机器人,本身就是一场不对等的较量。
(2017年星际争霸AI大赛排行榜)
如果说Facebook的人工智能技术虽然最终未能取得好成绩,但尚且能和人类精心编制的脚本机器人一战的话,那发明了AlphaGo的DeepMind目前则被星际争霸2彻底玩坏了。
DeepMind与星际争霸2
此前,DeepMind和星际争霸系列制作公司暴雪联合推出了星际争霸2的机器学习平台sc2le,DeepMind借此希望在继AlphaGo后在星际争霸2上继续挑战人类,但令人失望的是,目前DeepMind在星际争霸2上进展缓慢。在今年7月底,DeepMind发表了一篇论文《StarCraft II: A New Challenge for Reinforcement Learning》系统阐述了他们在星际争霸2中的进展,在论文中DeepMind承认了目前的深度学习与增强学习框架在星际争霸2中并无任何理想的结果(...However, when trained on the main game, these agents are unable to make significant progress),AI甚至还远远比不上游戏自带的简单电脑(很弱的脚本机器人)。既然在全局游戏中表现非常差,DeepMind不得不退而求其次,设计了7个星际争霸2的迷你游戏,包括:
1. 寻路(“MoveToBeacon”);
2. 收集散落水晶(“CollectMineralShards”);
3. 寻找并消灭小狗(“FindAndDefeatZerglings”);
4. 消灭蟑螂(“DefeatRoaches”);
5. 消灭小狗和毒爆虫(“DefeatZerglingsAndBanelings”);
6. 收集水晶和气(“CollectMineralsAndGas”);
7. 训练机枪兵(“BuildMarines”);
在上面难度相当于Atari小游戏的迷你任务中,DeepMind的人工智能的表现才勉强达到合格线。下图是DeepMind在论文中总结的任务得分数据,在寻找并消灭小狗和消灭蟑螂游戏中AI接近、超越了普通人类玩家(DeepMind 自家工作人员),在寻路上接近了人类高手。
(DeepMind在7个迷你游戏的表现得分)
然而,上述7个迷你游戏相对于星际争霸2的全局游戏相差悬殊,DeepMind通过迷你游戏的设计将星际争霸2人工智能试验降低到Atari小游戏级别的难度,并不意味着人工智能在星际争霸2这款类似人类现实世界对抗/战争简化模拟的游戏上有太多显著的突破。而究其原因,在于星际争霸2的决策空间巨大,涉及了在收集资源、建设建筑、训练部队、局部战术等方面的海量决策,其决策空间远高于只有落子一个动作的围棋。另外更要命的是,RTS游戏由于进程较长,其策略的回报(reward)趋向长期,即意味着难以定义类似于Atari游戏中Agent非常明确的回报,这使得DeepMind在Atari游戏中屡试不爽的Reinforcement Learning变得难以凑效。
于是DeepMind似乎希望后续把研究回归到传统的监督学习方向,借助海量的星际争霸2人类玩家对局replay数据去优化学习的效果。在论文中通过replay增强学习后,Agent在采矿和造兵上等任务上相比此前自学有了显著的提升。
之所以说了这么多AI与星际争霸2的事情,是因为从中我们可以看到一个关键性的现象:在类似于星际争霸2这种复杂任务(决策空间巨大)之中,在计算机视觉、机器翻译、语音识别等领域取得了巨大成功的主流深度学习方法,事实上难以取得太多的成果,甚至连DeepMind也承认,在星际争霸2的尝试中他们遇到的困难远远高于此前的估计。而这是因为,当前的主流深度学习方法并不完美,其一切都是建立在海量的训练数据基础上。
算法不够,数据来凑
众所周知,目前深度学习在人工智能中所取得的成功,实际上建立在三大驱动因素上:算法、数据和算力。首先主流的深度学习算法近年来变化越来越少,同时深度网络的架构本身似乎对于效果的产出正在减弱,而真正让主流深度学习方法在计算机视觉、机器翻译、语音识别等领域取得了巨大成功的关键驱动力是数据。深度学习区别于传统机器学习方法的最大特征,是深度学习可以使用海量的数据去提升自身的表现(Performance),这可以用一幅经典的图表去展示。下图中横坐标是使用的训练数据量,纵坐标是算法表现,传统的机器学习算法往往在数据量超过一定的阈值后,其表现就难以继续随着训练数据量而提升,更多的数据输入仅仅是浪费;而大型的深度神经网络模型犹如一只大水桶,在装入了更多的数据后其表现能够继续攀升,数据成为了深度学习的核心驱动力,缺乏了海量的标注数据,深度学习的效果并不会比传统机器学习方法有太大的改善。而最后算力是保障如此巨大的海量数据能跑在深度学习框架上的基础能力,从某种角度理解NVIDIA的股价,是建立在数据科学界需要将海量数据注入深度神经网络并进行大量前向/方向传播的基础上。
(来源于Andrew Ng神经网络和深度学习课程)
甚至,我们能以以下公式描述当今的人工智能业态:
当今人工智能 = 海量的标注数据 + 简单粗暴的前向/后向传播计算
于是AI界开始了标注数据收集的军备竞赛,类似Amazon Mechanical Turk的数据标注众包平台不断涌现,而自身具备了海量数据资源的BAT或者搜狗,一夜之间在语音识别准确率上纷纷接近甚至超越了在语音识别深耕了超过十年的科大讯飞。标注数据的价值,让大数据时代一句经典的话——“数据即将成为新时代的电力”变得前所未有的真实。一个个如ImageNet等人工智能竞赛中不断被打破的准确率记录,其背后是无数的人力物力被投入到高质量的标注数据之中,人工智能一定程度上,甚至可以理解为有多少人工,被投入到数据标注之中,就能有多少智能。
然而,过分依赖海量标注数据的主流深度学习方法目前面临了越来越多的挑战,首先在某些标注数据难以收集或者收集代价很大的领域,让AI应用的建立变得举步维艰,比如在智慧医疗中,高质量的医学影像标注数据收集门槛非常高。另外更为重要的是,海量标注数据+深度学习框架+GPU并行计算的简单粗暴模式,在越来越多领域被证明或许没有大家想象的那么管用,上一节DeepMind在星际争霸2中的努力是其中一个案例。
究其原因,当下主流的深度学习方法或许并不是最优的范式。目前有越来越多的人在反思深度学习的局限和缺陷,甚至包括了深度学习之父Geoffrey Hinton本人。大多数学习过深度学习的人基本都练习过经典的cats vs dogs(猫狗大战)数据集,即从数万张已标注的猫咪和狗狗照片,训练神经网络判断一张图片的类别。但对于人类而言,我们并不需要如此大量的标注去让我们学习一种动物是猫咪,即使对于一个从来不知道猫的幼儿,在见过几次猫之后就能认知到这种实际上是一种区别于其他动物的物种,哪怕不知道它的语言名称,当某一天有人告诉她这种生物叫“猫咪”后,只需要这一次“标注”(One-shot learning),她以后就能准确分辨出每一只猫。然而对于当前深度学习来说,依赖的是大量的数据标注,这种One-shot learning是极其艰难的挑战。
在这里,我们能总结性地说一句,大数据让深度学习插上了腾飞的翅膀,但同样也成为了深度学习飞翔到更多领域的障碍。毕竟在很多领域海量的标注数据不是那么容易获取,甚至“标注”本身也是一项极其难定义的事情,比如在星际争霸2中,我们应该如何更好地标注replay数据,让AI能更好地进行监督学习?甚至进一步说,这种标注行为也许并不是一个明智的选择,正如人类并不需要在学会玩星际争霸之前,首先得看成千上万场别人的replay去学习各种玩法。
人工智能的下半场
在计算机视觉、机器翻译、语音识别等标注数据获取相对代价低廉的领域,诚然我们看到了主流深度学习方法所取得的巨大成功,这不仅是孜孜不倦积累30多年的深度神经网络技术的集中爆发,也使得深度学习引领人工智能进入了目前的炽热状态。但必须实事求是地说,越来越多的证据表明,当前主流深度学习方法也许并不是一项普适性技术,在更多类似星际争霸2等任务极其复杂、数据难以标注的领域,也许我们需要的是新的方法。
深度学习之父Geoffrey Hinton最近公开号召摒弃现有深度学习(主要是反向传播、CNN)范式,重新奋力向前寻找全新的道路。Hinton认为,要想让神经网络能够自己变得智能,即实现不依赖海量标注数据的“无监督学习”,意味着需要放弃反向传播等目前主流深度学习理念。对于在深度学习领域中,地位犹如爱因斯坦于物理学界的Hinton,要质疑甚至推翻自身花费了十几年心血所建立的主流深度学习方法,必然是需要具备极其巨大勇气的,我们甚至可以合理推测,Hinton老爷子心中必定是对人工智能未来有了新的vision,才能驱使他坚定地做出如此艰难的选择。
当然,也许只有类似Hinton等极少数人才能拥有对于未来技术演进的vision,但立足于对当前业态的观察,我们也能发现目前主流深度学习的势能似乎已经在逐渐减弱,也许这就是当前人工智能业界最大的风险所在。
海量的标注数据,加上简单粗暴的前向/后向传播计算,也许并不是人工智能未来的全部,从今天开始,我们最好把这点记在心中。
相关文章:
1024程序员节,你是我们要找的那条锦鲤吗?
参加2018 AI开发者大会,请扫描海报二维码 叮咚,您有一封 #1024吐槽狂欢派对# 邀请函请查收。 ▌什么是程序员? 全员格子、黑框眼镜,还是等于创造力忍耐力? 刻板标签、思维定式,还是高阶自黑玩梗幽默&#…

虚拟机管理你的服务器,全面解析VMware的虚拟机管理解决方案
本教程将为你讲述VMware的虚拟机管理解决方案,说起虚拟机,VMware绝对可以算的上是个中翘楚了,并且VMware的虚拟桌面结构解决方案可以起到增强管理效率,降低成本等等效用,话不多说,这就为大家介绍。Vmware的…

针对抓win2003系统密码的诡计
命令行下卸载win2003 sp1/sp2 %systemroot%\$NtServicePackUninstall$\spuninst\spuninst /U 按无人参与模式删除 service pack。如果使用此选项,那么在卸载 SP1 的过程中,只有出现致命错误才会显示提示。 /Q 按安静模式删除 SP1,此模式与无人…

那个曾经为美国NASA开发火星大脑的AI公司,现在和华为合作了
2010 年,美国航天航空局 NASA 敲响了一家创业公司的大门,希望他们参与火星探测器“大脑”的研发项目。这家公司就是 Neurala,一家专注于深度学习技术的波士顿初创公司。 NASA 的要求是一个艰难的挑战,因为火星探测器自身计算能力…

艾伦人工智能研究院开源AllenNLP,基于PyTorch轻松构建NLP模型
艾伦人工智能研究院(AI2)开源AllenNLP,它是一个基于PyTorch的NLP研究库,利用深度学习来进行自然语言理解,通过处理低层次的细节、提供高质量的参考实现,能轻松快速地帮助研究员构建新的语言理解模型。 Alle…

3650服务器性能,全新联想System x3650 M4服务器性能出色
系统支持Microsoft Windows Server 2008 R2Microsoft Windows Server 2008,Datacenter x64 EditionMicrosoft Windows Server 2008,Datacenter x86 EditionMicrosoft Windows Server 2008,Enterprise x64 EditionMicrosoft Windows Server 20…

不只翻译机,搜狗将在半年内推数款智能硬件产品
10月24日已是昨日,但属于开发者的1024一直都在——2018 AI开发者大会就是你的1024。11月8-9日,现场聆听国内外AI大牛的深知灼见,与工业界AI应用思维紧密同步,收获60技术大咖的干货分享。扫码填写大会注册信息表,就有可…

Windows Embedded Standard开发初体验(四)
添加文件、依赖组件、注册表 接下来我们就要进入创建组件最重要的一环了,添加文件。为什么说重要,因为这里有一个大坑,我在Windows Embedded Standard产品组施卫娟老师的指导下,花了两周的时间才勉强爬出来,可见该坑之…

Windows 2003 + ISA 2006+单网卡×××配置(4)
(接上)图13 然后下一步,用户集默认所有用户,不用改变,直接下一步,完成,然后会出现如图14图14照样还是点击应用。。。好了,都配置完了,下面我们做个测试。。。我本机的IP地…

科大讯飞全新1024:3大计划,200项A.I.能力,全链路驱动应用场景创新!
10月24日,2018届科大讯飞全球1024开发者节在合肥奥林匹克体育中心综合馆如约举行,重磅发布了全新升级的科大讯飞《1024计划》!原中国科学技术部副部长张来武、科大讯飞董事长刘庆峰、科大讯飞轮值总裁胡郁、讯飞听见事业部总经理王玮分别发表…

SQL基本语句
掌握SQL四条最基本的数据操作语句:Insert,Select,Update和Delete。练掌握SQL是数据库用户的宝贵财 富。在本文中,我们将引导你掌握四条最基本的数据操作语句—SQL的核心功能—来依次介绍比较操作符、选择断言以及三值逻辑。当你完…

【TP3.2】路由匹配和规则
TP3.2框架的路由匹配和规则处理: 包括:静态路由,动态路由,多参数路由、正则路由 <?php return array(//配置项>配置值/* * 路由开启和匹配。首先开启路由匹配,然后根据相应的路由规则进行匹配* 1、静态路由* 2、…

soul一直显示正在登录聊天服务器,soul这个软件,为什么有些人在玩的时间很久以后(两百天以上),就不会再主动和其他人打招呼了?...
起首,说一下我本人接触soul的那些年。记得玩soul是17年开端,最初这个软件的营销目标是为了让人们更好地交换,停止跨时空的深度聊天,寻求魂魄的朋友,而不是皮郛的一时好感。可能说当时soul是打着"丢脸的皮郛千篇一…

构建插件式的应用程序框架(八)----视图服务的简单实现(ZT)
我在前一篇文章里提到,对于停靠工具栏或者是视图最好是不要将实例放到词典中,而是将工具栏或者视图的类型放到词典中,因为视图类型会经常的被重用,并且会经常被关闭或者再打开。当实例被关闭后,资源就被释放了…

服务器怎么设置网站写入权限,如何设置服务器写入权限设置方法
如何设置服务器写入权限设置方法 内容精选换一换将用户组添加至企业项目中,并为其设置一定的权限策略,该用户组中的用户即可拥有策略定义的对该企业项目中资源的使用权限。本小节指导您如何为企业项目添加用户组并授权。分辨率低的情况下单击页面右上方的…

CSDN蒋涛提出技术社区三倍速定律,称下一个20年全球开发者数量将过亿
10 月 24 日,科大讯飞 1024 开发者节在合肥举行,中国 IT 技术社区 CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛受邀发表了主题演讲。 在演讲中,蒋涛提出了“技术社区三倍速定律”,如何理解? 2013 年 CSDN 上关于…

可穿戴医疗设备火爆背后的困境
目前在电商平台搜索可穿戴手表、手环等可穿戴产品,品牌不下百种。市场调研机构IDC发布的最新报告显示,今年第一季度全球可穿戴设备发货量达到1140万部,同比增长200%,连续第八个季度实现增长。但是目前的可穿戴医疗设备基本停留在外…

【华为AI十强应用·上卷】官宣!这里的AI应用“神了”……
现在大火的AI,从概念落地到成为人们普遍接受的现实,度过了将近70年的时间。而当下,AI正在以最切实的方式影响着人们的生活,无论是工作还是娱乐,所以眼前的2018年正是AI为主流“代言”的关键一年。别说,还真…

JavaScript类——鼠标点击下笑脸变化
2019独角兽企业重金招聘Python工程师标准>>> <!DOCTYPE html> <html> <head> <meta charset"UTF-8"> <title>动态笑脸</title> <style> * { box-sizing: border-box; } .container { width: 400px; min-height…

VS2005字符串资源不能识别转义字符
在做LED媒体播放室多语言版本的时候,遇到这么一个问题, 检查office2003是否存在,如果不存在则弹出一个警告窗体。由于是多语言版本,所以弹出的信息来源于资源文件。 如果对提取的资源字符串不做任何处理,则弹出如下的对…

大掌柜商业管理系统服务器地址,大掌柜软件通用版操作说明.doc
大掌柜软件通用版操作说明PAGEPAGE 157系统应用基础内容提要:大掌柜软件专业版对系统的要求数据库SQL server2000的安装大掌柜软件专业版服务器端与客户端的安装加密狗的安装1.1系统运行环境系统运行环境的配置无疑是确保软件正常运行的重要条件之一,软件…

r语言remarkdown展示图_使用R语言包circlize可视化展示blast双序列比对结果
circlize这个包还挺强大的,R语言里用来画圈图还挺方便的。 今天这篇文章记录用circlize这个包画圈图展示blast双序列比对结果的代码植物线粒体基因组类的文章通常会分析细胞器基因组间基因转移情况,基本的分析方法就是blast比对。可视化展示可以选择用这…

吴恩达说“将引领下一波机器学习技术”的迁移学习到底好在哪?
AI技术年度盛会即将开启!11月8-9日,来自Google、Amazon、微软、Facebook、LinkedIn、阿里巴巴、百度、腾讯、美团、京东、小米、字节跳动、滴滴、商汤、旷视、思必驰、第四范式、云知声等企业的技术大咖将带来工业界AI应用的最新思维。 如果你是某个AI技…

获取系统相关属性
uname -a uname -r cat /etc/issue cat /etc/redhat-release #进入centos后忘记自己安装的是6还是7,可以从这里查看 转载于:https://www.cnblogs.com/biaopei/p/7730684.html

双水泵轮换工作原理图_「物业管理工作」水泵维护保养规程
1 目的为规范水泵维护保养程序,特制定本规程。2 适用范围适用于公司管辖范围内水泵(包括生活水泵、消防水泵及集水坑潜水泵)及其相关设施的维护保养。3 职责3.1 给排水维修工负责水泵的维护保养。3.2 值班锅炉工或电梯工负责晚间协助对水泵房设备运转情况的巡查。3.…

Dropbox如何使用机器学习从数十亿图片中自动提取文字
参加 2018 AI开发者大会,请点击 ↑↑↑作者 | Leonard Fink译者 | 刘旭坤整理 | Jane出品 | AI科技大本营【导读】提到 Dropbox,大家可能都知道这是一个文件同步、备份、共享的云存储软件。其实 Dropbox 可以实现的功能远不止这些。今天就为大家介绍 Dr…

001_性能压测工具
一、 Jmeter

SharePoint Server 2007 页面模型
虽然SharePoint Server 2007使用了ASP.NET 2.0的基础页面模型,SharePoint页面基本上也是基于标准的aspx技术来构建,但SharePoint Server 2007的页面模型仍然要比普通的ASP.NET应用复杂很多。对于一个SharePoint开发人员(和设计人员࿰…

oracle存储过程的常用语法
记录一下,主要方便自己以后查找: createorreplaceproceduresp_test(aa invarchar,bb innumberdefault0) isv_pos varchar(50);v_num number;begin---字符串查找和替换selectSUBSTR(PARAMETER, 1, INSTR(PARAMETER,branchId)-2) ||SUBSTR(PARAMETER, INST…
机器学习大神迈克尔 · 乔丹:我讨厌将机器学习称为AI
AI技术年度盛会即将开启!11月8-9日,来自Google、Amazon、微软、Facebook、LinkedIn、阿里巴巴、百度、腾讯、美团、京东、小米、字节跳动、滴滴、商汤、旷视、思必驰、第四范式、云知声等企业的技术大咖将带来工业界AI应用的最新思维。 如果你是某个AI技…