阿里达摩院2020趋势第一弹:感知智能的“天花板”和认知智能的“野望”
作者 | Just
出品 | AI科技大本营(ID:rgznai100)
“感知智能与认知智能是相辅相成的关系。认知智能需要感知系统来进行信号处理和概念识别,而感知系统也需要认知系统的反馈来决定如何进行更有效的提取和识别。”
1月2日,阿里巴巴达摩院发布2020十大科技趋势(https://damo.alibaba.com/events/57),其中趋势预测的第一弹即为“人工智能从感知智能向认知智能演进”。AI发展为什么会有这种演进?从技术层面,AI科技大本营(ID:Rgznai100)采访了达摩院资深算法专家杨红霞,就感知智能向认知智能的演进和变革进行更深入解读。
感知智能的“天花板”
如你所知,目前人工智能在图像、音频、文本的识别等感知操作方面取得了巨大成功,太多企业的新闻稿中传递着AI在诸多特定任务上已经达到或超越了人类水准的消息。很大程度上,感知智能技术的诸多成果归因于强大的算力和大量的标注数据。
杨红霞指出,AI目前对于单一任务上取得的成绩,如图像识别、机器翻译等均是通过海量样本的堆砌与合适深度学习模型架构得到,这与人类学习的过程非常不一样:目前感知智能技术的方式是learn from scratch(从无到有),而人类学习是有体系的、多模态、多任务的continuous learning(连续学习)。
她认为,感知智能目前还只是任务驱动,做到从底层信号到最终结果的条件反射,而不是经过显式的、高维的、概念的识别和组合。但这种概念识别和组合的能力才是人类能处理各种不同任务或者新任务的基础。
而单一任务模型的训练消耗已经非常庞大,“BERT模型需要30亿词量的训练数据,训练一次产生相当于1400磅的二氧化碳,这与一个人来回坐飞机穿越美洲的排放量相当。”
这样的技术路线难以为继。她称,想要再通过更大数据量和更大模型来继续这样的模型线路可能已经很难取得真正意义上的突破。
更重要的是,感知智能本身存在的技术问题并没有真正得到解决。“我们可以轻易攻击一个模型从而产生极大的安全隐患,换到另一个没有样本覆盖的场景模型就像傻瓜一样,这都对人工智能模型和机制层面的改进都提出了迫切的要求。”
杨红霞总结了三点感知智能技术存在的缺陷,包括但不限于:
模型鲁棒性差。对于样本分布敏感,迁移到少样本新任务上的能力差,模型极易受到攻击;
模型可解释性差,对于可靠性要求高的任务很难胜任;
缺乏积累知识的能力,也没能和人类已有的知识体系进行很好的关联,缺乏可靠的推理方法。
总之,无论是在具备智能理解能力还是安全性方面,以感知智能技术为主的AI与人类智能相去甚远。
为了突破这些感知智能局限性,AI需要向认知智能演进。她给出了研究方向,“更多的去研究如何绑定、发现、积累可理解的可分解性的概念以及概念间的关系,融合基于高纬度概念的可靠的推理方法,从而提高模型的稳定性与可靠性,完成可靠的逻辑推理。”
达摩院指出,相较于感知智能这一人工智能1.0,人工智能2.0将更多基于数据,能够自动将数据变成知识,从非结构化的数据直接变成有结构化的知识,做到真正意义上的认知智能。在探索如何在保持大数据智能优势的同时下,赋予机器常识和因果逻辑推理能力,实现认知智能成为了当下人工智能研究的核心。
认知智能的“野望”
去年开始,认知智能开始被AI界摆在下一步AI技术变革的台面上进行广泛讨论。
认知智能可以帮助机器跨越模态理解数据,学习到最接近人脑认知的“一般表达”,获得类似于人脑的多模感知能力,有望带来颠覆性创新的产业价值。达摩院称,认知智能的出现使得AI系统主动了解事物发展的背后规律和因果关系、而不再只是简单的统计拟合,进一步推动下一代具有自主意识的AI系统。
一些学界的研究者已经率先出发,图灵奖得主Yoshua Bengio频繁强调可解释因果关系对深度学习的重要性。杨红霞也特意提及Bengio在近期的 NeurIPS 2019 上题为《From System 1 Deep Learning To System 2 Deep Learning》的报告,后者也指出认知智能是接下来人工智能的重点突破方向。
Bengio报告的核心内容提到,人的认知系统包含两个子系统(这是认知理论中的共识观点):System1直觉系统,主要负责快速、无意识、非语言的认知,这是目前深度学习主要做的事情;System2是逻辑分析系统,是有意识的、带逻辑、规划、推理以及可以语言表达的系统,这是未来深度学习需要着重考虑的。当然Bengio也提到计算机作为Agent实现AI,需要从计算机角度考虑,比如更好的模型和知识搜索等。
Bengio认为,对于计算机来说,最关键的是处理数据分布中的变化。对于System 2来说,基本的要素包括:注意力和意识。注意力(attention)实际在目前的深度学习模型中已经有大量的实现和探讨,比如GAT(图注意力机制)等;意识这部分则比较难,其实意识最关键的是定义到怎样的边界。在他看来,意识先验可以使用稀疏因子图模型来实现,这是一个思路,实现了因果关系。从整体的理论框架方面可以考虑元学习(Meta-learning)、局部修正假设(localized change hypothesis)、因果发现(causal discovery),最后架构方面可以考虑如何学习不同对象的操作。
这是认知智能技术的其中一条技术研究路径,杨红霞则概括了四大类将有所突破的关键方向。
a. 推理系统的建设
基于(神经)符号系统的关系推理
感知系统和认知系统协同推理 System 1&2
b. 与人类知识融合
融合结构化知识图谱的推理模型
c. 从人类学习方式入手
Continuous Learning(连续学习)
d. 从认知发展的根源入手
Emergent language/communication/tool use
她称,目前比较亲民的应用主要来自于b(与人类知识融合),在各类问答系统中,都会融合外部知识图谱来完善。
当然,既然阿里将认知智能放在第一大趋势预测的位置,那么他们在其研究和应用上有何探索或进展?杨红霞提到,基于认知学Dual Process Theory(双重加工理论)将认知推理任务转化为System 1&2之间的迭代式交互,System 1利用感知系统进行语义解析形成一张概念图并作为类似人脑中的Working Memory,而System 2可以充分考虑Working Memory中的关系网络从而进行精细推理。多跳阅读理解任务中,他们利用这个系统取得了世界第一的成绩。
他们也在考虑如何发现Compositional的高级概念,这与人类的binding problem(捆绑问题)息息相关。他们首次在电商场景下研究怎样对用户和商品进行解离化表征,从而能够显式化的表示宏观的兴趣意图和微观的电商认知概念,从而利用这些显式的概念进行可控的搜索和推荐。
另外,阿里研究人员也结合电商知识图谱做了大量的工作,如结合图谱进行更好的主题标题、推荐理由生成,提升了用户的购物体验。
达摩院在趋势预测中还指出,认知智能将结合人脑的推理过程,进一步解决复杂的阅读理解问题和少样本的知识图谱推理问题,协同结构化的推理过程和非结构化的语义理解。认知智能也需要解决多模态预训练问题,帮助机器获得多模感知能力,赋能海量任务。其中,大规模图神经网络也被认为是认知智能计算的强有力的推理方法。
尽管未来人工智能热潮能否进一步打开天花板,形成更大的产业规模,认知智能被寄予厚望,不过在需要外部知识、逻辑推理或者领域迁移的认知智能领域,显然还处于初级探索阶段。
达摩院预计,认知智能将从认知心理学、脑科学及人类社会历史中汲取灵感,并结合扩领域知识图谱、因果推理、持续学习等技术,建立稳定获取和表达知识的有效机制,让知识能够被机器理解和运用,实现从感知智能到认知智能的关键突破。
(*本文为AI科技大本营原创文章,转载请微信联系1092722531)
◆
精彩推荐
◆
推荐阅读
11年艺术学习“转投”数学,他出版首本TensorFlow中文教材,成为蚂蚁金服技术大军一员
清华官宣:前百度总裁张亚勤正式加盟清华大学
小米回应“米家”商标争议;人人 App 回归社交市场;TiDB 2.1.19 发布| 极客头条
迁移学习前沿研究亟需新鲜血液,深度学习理论不能掉链子
详解GPU技术关键参数和应用场景
链版“微信”,27 岁身价达 2.5 亿美元
“微软让我损失了两亿美金!”
太逆天!程序员当总统、拿下《国家地理》全球总冠军、成著名歌手!
区块链重塑人类社群生态
你点的每个“在看”,我都认真当成了AI
相关文章:

Java 对synchronized的补充Lock锁
Java并发编程:Lock 从Java 5之后,在java.util.concurrent.locks包下提供了另外一种方式来实现同步访问,那就是Lock。 也许有朋友会问,既然都可以通过synchronized来实现同步访问了,那么为什么还需要提供Lock࿱…
有奖评选 | 2020年的AI技术公开课,你想听到哪些干货?
CSDN技术公开课有奖评选开始啦~~听过课的小伙伴们,哪位讲师的分享让你获益匪浅?记得给TA投票哦!投票后获取入群方式,参与抽奖,奖品很丰厚哦~~进入付费时代,如今我们看似只要招招手,一切知识随手…
一个分析“文件夹”选择框实现方法的过程
在软件开发中,我们如果存在“导入导出”的场景时,难免会用到“文件夹”选择框。之前一直没有太关注过这个的实现过程。最近在工作中遇到了一些问题,我做了一些研究。在此记录下研究的过程。(转载请指明出于breaksoftware的csdn博客…

Openssl req命令
一、简介 req指令用来创建和处理PKCS#10格式的证书 二、语法 openssl req [-inform PEM|DER] [-outform PEM|DER] [-in filename] [-out filename] [-text] [-pubkey] [-noout] [-verify] [-modulus] [-nodes] [-subject] [-passin arg] [-passout arg] [-key filename] [-key…
使用windbg抓取崩溃文件和分析的过程
在软件编程中,崩溃的场景比较常见的。且说微软技术再牛X,也是会出现崩溃的场景。网上有一段Win98当着比尔盖茨蓝屏的视频非常有意思。 (转载请指明出于breaksoftware的csdn博客)我们身边的很多软件都引入了dump生成和收集机制。但…
TF 2.1.0-rc2发布,2020年停止支持Python 2
作者 | 神经星星来源 | HyperAI超神经(ID:HyperAI)【导读】2020 年 1 月 1 日,Python 2 停止维护,正式退休。Python 3 全面登场的时刻,TensorFlow 也在悄悄改变。近日 TensorFlow 官方 GitHub 账号中,发布了…

重新认识笔记本锂电池的保养
重新认识笔记本锂电池的保养 对于笔记本电脑来说,电池可以说是一个比较重要的部件,它的效能直接关系到笔记本电脑在缺少电源的环境中的工作能力。而电池在笔记本电脑的众组件中又算是一个不折不扣的消耗品,因此涉及到笔记本电脑电池的保养和合…

nginx转发及后端服务器获取真实client的IP
针对nginx的模块介绍可以查阅wiki:http://wiki.nginx.org/Modules常用模块:HTTP CoreProxyRewriteUpstream 原理:squid,varnish以及nginx等,在做反向代理的时候,因为要代替客户端去访问服务器,所以…

AJAX的组成应用
表示层XHTMLCSS 动态显示和数据 DOM (文档对象模型)数据交互和操作 XML,XSLT 异步数据获取 XMLHttpRequest 绑定和处理数据 JavaScript XMLhttpRequest对象属性:Number readyState 4 表示完成Function onreadystatechange 回调函数string responseText XMLDocument responseXM…
打开,保存文件框的文本溢出排查
工作中遇到的这个问题还是很有意思的。其中嵌套了很多奇葩性的问题。 (转载请指明出于breaksoftware的csdn博客)我们来看下故事的发生过程,QA同学发现我们存在如下的bug 看到如此多的串,可以认为这个是典型的溢出问题。后来我咨询…
2020年,为什么说入坑AI是最好的时机?
2019年可以说是AI全面落地和商用的一年,产业智能化成为各个行业重点关注的发展方向,交通、工业、农业、医疗等主流行业无一例外。随着人工智能技术的进一步发展和落地,深度学习、数据挖掘、自动程序设计等领域也将在更多应用场景中得到实现。…

IIS 伪静态配置(安装ISAPI_Rewrite配置)
第一:首先到官方网站下载ISAPI_Rewrite 我的机子是32位的就下32位免费版的,链接地址如下: http://www.helicontech.com/download/isapi_rewrite/ISAPI_Rewrite3_0064_Lite.msi 可以选择不同版本:http://www.helicontech.com/downl…
Github标星24k,127篇经典论文下载,这份深度学习论文阅读路线图不容错过
作者 | Floodsung翻译 | 黄海广来源 | 机器学习初学者(ID:ai-start-com)【导读】如果你是深度学习领域的新手,那么你可能会遇到的第一个问题是“我应该从哪篇论文开始阅读?”本文就是一篇深度学习论文的阅读路线图!该…

c/c++面试
1. static在c,c中有什么不同点2. 堆和栈的区别3. 纯虚函数4. 指针和引用的区别5. 如果构造函数出错,如何处理?6. 对设计模式是否熟悉,用过哪些?7. c如何使用c中的函数,为什么?整理:1…

一种解决启动进程传递参数过长的方法
工作中,QA同学在测试我们程序的时候,发现在XP下,我们的A进程无法启动我们的B进程。而在Win7 64bit系统下功能正常。RD同学调试后,发现我们A进程中使用ShellExcute去启动了B进程(转载请指明出于breaksoftware的csdn博客…

Ubuntu“无法获得锁\加锁”解决方案
2019独角兽企业重金招聘Python工程师标准>>> 当你添加了源,更新源的时候,如果中途中断了更新,安装软件或者再次更新的时候就是出现如下提示, E: 无法获得锁 /var/lib/apt/lists/lock – open (11: 资源暂时不可用) E: …

一步一步学Silverlight 2系列(3):界面布局
概述 Silverlight 2 Beta 1版本发布了,无论从Runtime还是Tools都给我们带来了很多的惊喜,如支持框架语言Visual Basic, Visual C#, IronRuby, Ironpython,对JSON、Web Service、WCF以及Sockets的支持等一系列新的特性。《一步一步学Silverlig…

一种准标准CSV格式的介绍和分析以及解析算法
CSV是一种古老的数据传输格式,它的全称是Comma-Separated Values(逗号分隔值)。出生在那个标准缺失的蛮荒年代,CSV的标准一直(到2005年)是NULL——世间存在着N种CSV格式,它们自成体系࿰…
新战场路在何方——详解360金融数据中台之旅
作者 |360金融架构总监黄建庭出品 | AI科技大本营(ID:rgznai100)本文为CSDN即将推出的《新战场:决胜中台》专刊的第 4 篇文章。自阿里巴巴引入中台概念后,市场对中台的关注度持续“高烧”不退。作为企业的基础平台,数据…

oracle中的exists 和not exists 用法详解
有两个简单例子,以说明 “exists”和“in”的效率问题 1) select * from T1 where exists(select 1 from T2 where T1.aT2.a) ; T1数据量小而T2数据量非常大时,T1<<T2 时,1) 的查询效率高。 2) select * from T1 where T1.a in (select…

现代内存编号解读(转)
现代SDRAM、DDR SDRAM、DDR2 SDRAM三种主流内存颗粒的编号一、DDR SDRAM:HYNIX DDR SDRAM颗粒编号:HY XX X XX XX X X X X X X X — XX X1 2 3 4 5 6 7 8 9 10 11 12 — 13 14整个DDR SDRAM颗粒的编号,一共是由14…
被追捧为“圣杯”的深度强化学习已走进死胡同
作者 | 朱仲光编译 | 夕颜出品 | AI科技大本营(ID:rgznai1100)【导读】近年来,深度强化学习成为一个被业界和学术界追捧的热门技术,社区甚至将它视为金光闪闪的通向 AGI 的圣杯,大多数人都看好它未来发展的巨大潜力。但…
一种清除windows通知区域“僵尸”图标的方案——问题分析
通知区域名称有趣的历史 假如说到windows通知区域,可能很多人还是不清楚它是什么。如果改称Tray区域,可能有人就懂了。如果再白话点,叫它“托盘”或者“系统托盘”,可能会有更多的人猜到它是windows什么部位。现在我们揭开…

Apache2.4+Tomcat7集群搭建
一、安装jdk、Tomcat、Apache1.安装jdk1.7cd /home/java/software #把软件下载到/home/java/software目录下,将应用安装到/home/java目录下。 wget http://download.oracle.com/otn/java/jdk/7u80-b15/jdk-7u80-linux-x64.tar.gz tar -zxvf jdk-7u80-linux-x64.tar…
一种清除windows通知区域“僵尸”图标的方案——XP系统解决方案
XP下“僵尸”图标的解决方案 从《一种清除windows通知区域“僵尸”图标的方案——问题分析》(以后简称《问题分析》)一文中分析的通知区域结构可以看出,XP的通知区域结构是相对简单的。如果我们解决了XP下的问题,那么Win7上的问题…

《评人工智能如何走向新阶段》后记(再续12)
由AI科技大本营下载自视觉中国151. 新一代人工智能研究方向: (1)研究新一代人工智能基础理论(机理、模型和算法);(2)研发面向需求的共性技术(以神经网络和算法为核心、数据和硬件为基…

正则表达式测试工具 Regex Tester 的使用方法
2019独角兽企业重金招聘Python工程师标准>>> 正则表达式测试工具“RegexTester”,下载地址:http://www.oschina.net/p/regextester 一、关于本文 今天的工作中遇到了一些正则表达式,我需要检验它们是否正确,不过我对自…
一种清除windows通知区域“僵尸”图标的方案——Windows7系统解决方案
Windows7下“僵尸”图标的解决方案 从《一种清除windows通知区域“僵尸”图标的方案——问题分析》(以后简称《问题分析》)一文中分析的通知区域结构可以看出,Windows7的通知区域比XP通知区域多出了一个“临时”系统通知区域(转载…

《评人工智能如何走向新阶段》后记(再续13)
由AI科技大本营下载自视觉中国161. 引自美国科技媒体TNW记者对美欧企业主管与AI专家的访谈录摘要,谈到2020年AI的八大趋势: ①人工智能将使医疗保健更准确、成本更低; ②可解释性和信托及AI伦理将受到更多关注; ③在人工智能领…

在特定情况下的简单SSO实现方案
最近需要实现类似单点登录的功能。情况是这样的,最初在做网站A,做着做着,要做网站B了,要求与网站A完全分开作为两个应用,但用户数据要求与网站A保持一致,也要求用户在网站A登录后,转到网站B时不…