认知智能,AI的下一个十年 | AI Procon 2020
整理 | 屠敏
出品 | AI科技大本营(ID:rgznai100)
60 年间的「三起两落」 ,人工智能的沉浮变迁。
在 1956 年的夏天,人工智能在美国达特茅斯大学召开的学术会议之上蹒跚学步,吸引无数研究学者对其智能化的探索以及未来美好愿景的描绘。不过,彼时在抽象思维、自我认知、自然处理、图像识别等基础性功能缺失的现状中,人工智能的发展从门庭若市到门口罗雀,甚至不少人视人工智能程序为“玩具”。最终,这一冷清的局面,直到 80 年代,一款从神经系统到推理都有了明显跨越性进步的“专家系统”的人工智能程序出现才被打破。
然而,所谓期望越高,落差越大,在 AI 硬件市场需求不断下跌,人工智能技术未来走向不明的趋势之下,人工智能的第二个低谷期很快来临。值得庆幸的是,值此之际,除却资本的热炒后,诸如神经网络、图像识别、语音识别、深度学习等人工智能核心技术均进入了平稳的迭代期。21 世纪,AlphaGo 在人机对抗中一战成名,凭一举之力将人工智能再次推进大众的视野。下一步,人工智能又会经历哪些机与遇?
日前,在 CSDN 举办的第三届“AI开发者大会(AI Procon)”主会上,清华大学计算机系教授、系副主任唐杰带来了主题为《人工智能的下一个十年》演讲,深度分享了人工智能的发展历程,及其背后的核心技术驱动,同时探讨了人工智能下一步的认知与推理、意识等种种的挑战。
以下内容为演讲实录,由 AI科技大本营(ID:rgznai100) 整理:
人工智能发展很快且已经进入第三个浪潮,诸多的国家也相继将人工智能列为国家发展计划。从趋势上,AI 在近十年间,从计算、感知到认知逐步迭代;在应用上,从博弈对策的 AlphaGo 开始,落地到无人驾驶、图像识别等相关场景中,AI 的发展浪潮逐步攀至顶峰。那么,在技术层面,人工智能背后的支撑力及驱动力又是什么?
人工智能近 10 年
80 年代,机器学习风生水起
机器学习从 80 年代迅速发展,彼时决策树、贝叶斯、感知机、神经网络、多层神经网络算法的崛起,使得机器学习呈现出百花齐放、百家争鸣的盛况。
90 年代深度学习势头强劲
随着时间的推移,90 年代,序列标注模型的出现,以及 2000 年以后深度学习的逐渐成熟,驱动机器学习取得了长足的进步。而回看当下,深度学习、以及细分的技术包括循环智能、深度生成模型以及深度强化学习等模型也纷涌而至。
当然在整个发展历程中,每个领域都有开创者,人工智能的迭代也离不开一些核心人物的贡献。正如下图所述:
Geoffery Hinton 是最资深的深度学习玩家;
Yann Lecun、Frank Rosenblatt 和 Geoffery Hinton 都是图灵奖获得者;
AlphaGo 是在 David Sliver 的领导下研发出来的;
......
在技术落地上,近几年间,深度学习中预训练模型 BERT 是一个新的趋势。预训练模型的核心理念是通过大量的数据做预训练,基于此,针对特定的任务,进行微调。这一方法在自然语言处理中,超越了其他很多传统方法,表现尤为显著。正因此,2018 年也被业界称之为属于 BERT 的一年。
2019 年起,基于 BERT 思路,很多研究者在预训练模型上大下功夫,做出了很多开创性的工作。其中,生成模型作为人工智能领域一项重要的技术工作,也得到了很大的普及。生成模型通过大量的工具而生成,比如在视觉上,通过大量的训练,可以生成非常高清的视觉图像。
另外,从去年年底到今年初,自监督学习技术也有了最新的进展。即无需标记样本,即可学习图形表示。事实上,这一研究在几年前就已展开,譬如,让计算机通过大量的数据,就可以自动识别出猫。彼时环境下,很多人并不理解这件事的具体含义与技术,或许更多人认为这是一个很简单的问题,从机器学习角度来看,如果有一点点的标记样本,计算机就能识别这是一只猫。
那么,如果没有标记样本,计算机该如何识别出猫?
这就是自监督学习的魅力所在。它会通过数据本身的分析,比如给定一个图片 XQ,在大量的数据中自动找到 XQ 相关的图片,可以将这些图片作为正例,把其他随机找到另外一些图片作为负例,基于此,我们可以自动学习出哪些是一个正例,哪些是一个负例。在此过程中,或许有人提问,如果这里图片标注错误会怎么办?
事实上,在机器学习与人工智能的时代,大数据是基础,这就需要大量的数据为支撑。回归现下的自监督学习,在很多效果上,其甚至超过了有监督学习。
举例说明,我们研发了一个面向图数据的自监督学习。从下图中,如何让图数据划分正例和负例。首先,可以将蓝色的点视为正例。在图数据中,正例除了与自身属性有关,也与周围邻居节点相关。因此在海量数据中,任选一节点,随机生成一张子图 XQ,对于随机的子图,可能没有正例。
这可以再基于蓝色的点,随机生成另外的子图XK0,然后当做 XQ 的正例。同时从另外大量海量的图中,随机找一个点,如下图,再随机生成子图,即XK1,XK2,其中将 XK1 和 XK2 看做 XQ 的副例,把XK0看作 XQ 的正例,于是通过这样的方法,就能够自动构建了一个正例数据集和一个负例数据集,由此在超大规模的图数据上进行训练,最终发现效果可以超过有监督学习,因此,无监督学习也将必然是机器学习下一个重要的方向
基于此,我们研发了一个面向图数据的自监督学习。从下图中,如何让图数据划分正例与负例。举例说明,首先,将蓝色的点视为正例。在图数据中,正例除了与自身属性有关,也与周围邻居节点相关。因此从任一节点,随机生成一张子图。
那当然了,我今天要探讨的不是机器学习的一个无监督,而更加要探讨的是人工智能的下一代,人工智能今天这个符号AI,也经历了感知AI,那下一个AI是什么呢?
人工智能的未来
2016 年,张钹院士提出第三代人工智能雏形。DARPA 在 2018 年也发布了AI Next的一个计划,核心的思路是推进统计与知识推理融合,包括机器学习和脑认知的融合。
其实,想要实现认知智能,目前最缺乏两个方面:
高质量超大规模知识图谱,这是AI的基础设施。
对知识的理解能力,即面向认知的深度学习算法。相较于当下更像黑盒子的深度学习算法,我们更需要可解释、鲁棒、具有理解能力的机器学习方法,亦或者叫做推理算法。
未来,人工智能必是超越深度学习的存在。如图所示,左边的 Symbolic 即符号 AI。右边为深度学习,时下深度学习和机器学习处于交融的状态,业界很多人评价道,深度学习是机器学习的一小块,很多人有认为它超越了机器学习。事实上,想要超越深度学习,我们需要结合符号 AI,也就是最终的 Symbolic Neural Net。
在此之中,算法是核心,计算、数据是基础。不过,需要强调的是,场景更为重要。
同样以一个简单的例子为据:
在认知智能研究中,核心是基于知识图谱之上,并在认知推理、机器学习算法做逻辑表达。下述案例中,是一个较为经典的使用认知图谱做算法和认知的结构的问题:
在洛杉矶的 Quality Cafe 的咖啡店中,于 2003 年拍过电影的导演是谁?
如果人想要得到答案,或许会从洛杉矶或 Quality Cafe 地点着手,盘点在这个咖啡厅中拍过的电影有哪些,进而查找电影的导演是谁,在根据 2003 年的年份去判断,最终找到答案。
如果是机器,它会怎么完成?
在这里,倘若我们采用传统方法或深度学习如 BIDAF、BERT、XLNet 等算法,那么需要构建一个冗长的预训练上下文,从而进行推理匹配。这样做其实弊端很多,一方面,它是一个黑盒子,缺乏可解释性。另一方面,缺乏在知识上面的推理能力,所以未必会得出的最终结果。
针对这一问题,或许可以从关键点入手。首先可以从维基百科进行相应地查询,找到相关的实体,通过实体再做下一个选择,如从 Old school 找到 Todd Phillips,最终人脑进行一个推理决策,判断最终的答案。
在这个过程中涉及非常简单的两个阶段:
快速匹配。比如给定 Quality Cafe,我们会迅速找到维基百科的结果,或从大脑中的一个记忆系统中找到相关的记忆;
另外,我们会做决策推理,也就下面的这个过程,人脑进行思考,不过这个过程相对比较慢。
因为认知推理过程中,人脑在思考的时候,会有两个系统,被称之为双系统理论:
System 1 为直觉匹配,它具有无意识性,会快速地进行知觉匹配;
System 2 为逻辑分析,具有规划推理,带有意识的生产过程,做最后的决策。
时下的深度学习大部分针对 System1 也就是在做无意识的匹配,而未来的深度学习,更应该进行逻辑、规划、推理学习。那么,该双系统理论如何与上述的问题结合?对此,可以通过认知图谱的推理模型,与双系统对接,在这一过程中,System 1 做知识匹配,简单地将知识节点和知识正文匹配起来,System 2 进行决策。
根据上述案例,当问题出现后,我们首先突出两个实体,Quality Café 和 Los Angeles ,对 Quality Cafe 做快速匹配,从而找到相应的文档,并从中抽出新的实体,比如 Old School、Gone in 60 seconds,这两个实体都是两个电影的名字,System2 会做决策,会判断 Old School是我们要的答案吗?或者 Gone in 60 seconds 是我们要的。
在判断后,如果不是正确答案,那么它会将当前这个作为一个新的线索,放到 System1 中,这就和人脑推理的过程一模一样,System1 就会进一步做知识或实体的抽取,比如快速找到 Old school 对应的页面,从里面再抽出新的实体,像 Dodd Phillips,或者其他实体,System2 再做决策,于是这两个过程就变成抽取决策。
细分而言,对于 System1 实现,可以用 BERT 进行预训练,在预训练的基础上,我们可以做一个快速的匹配,而对于 System2 该如何实现?
此处,System2 可以用图神经网络把内容信息都结合进来,即每一个节点可以把上下文所有的信息进行整合,然后决策。如下图所述,基于神经网络、深度学习方法,实现了双系统理论的推理,继而两个系统可以互相协作,互相帮助。
最终,该推理可以帮忙回答非常深的各种推理过程的问题。譬如,Hotpot QA 是一个专门面向多条推理问题回答的数据,当时我们将认知图谱的方法 Quality Graph 应用在 Hotpot QA 后,可以发现,在第一列得出的 F1 值,比 BERT 相对高度弱 50% 多,绝对高度是原来的结果 31%。另外,它的可解释能力也非常强。
其实,人在认知过程中不一定是找到最佳的答案,而更需要的是,由推理过程,让人自己决定真正想要的答案。其中涉及到的推理过程可以用分支图或者树状图实现,如下图所示。围绕推理过程,还可以增强线索来帮助决策,如果答案不对也可以作溯源,解析并反诉答案为什么会推理错误,相当于是追诉的过程。
人工智能的挑战
立足于当下,探讨人工智能的下一步该何去何从?
剖开本质,认知和推理必然是人工智能下十年的重点。之所以这么判定,是因为从原来的大数据到知识到智能,中间最为缺乏的就是推理过程,因此我们需要克服该推理过程的挑战。以万亿级的长时知识图谱为支撑,在推理的基础上,来实现下一个人工智能的认知智能。
以 30 年为周期,人工智能的再下一步将会是意识——让计算机具有自我意识。个人而言,我认为所谓有意识学习,就是有目标的机器学习,给定数据,训练一个模型,通过模型进行分类(决策),如当观看某物时,你的眼睛会迅速做出一个有意识的判断或决策,这相当于有意识学习输出是一个短期记忆模型。不过,该短期记忆模型比较简单,数据有限、无背景知识。
而无意识对应的是长期记忆模型,类似于半监督或无监督学习模型,或者当下比较流行的预训练和自监督学习。无意识处理对应多种长期记忆,所以无意识可以考虑多个不同的处理器,这些处理器之间可以有链接,也可以没有,很多时候是并行处理,但针对特定任务,比如有意识思考某个问题的时候,形成特定连接,包括无意识处理器(无监督模型)和有意识处理器(有监督模型)之间的连接,这里可以考虑成fine-tune。
当然连接权重可以通过外界反馈强化学习来实现。无意识处理器之间的连接以及和有意识处理器之间的连接可以类比为注意力机制。最后值得注意的是长期记忆的构造和实现,人脑记忆保存的是模型图,而不是概念图。每个长期记忆的都可能是一个模型,可以生成样本,具体学习方法,可以想象一下是一个层次聚类。通过这样就可以用有监督、无监督、强化、注意力、fine-tune来实现GWT模型。
更多精彩推荐
☞机器学习算法易受攻击?阿里“安全基建”这样应对AI的不安全
☞代码恒久远,GitHub 永流传
☞腾讯员工每天在岗不足 8 小时被辞?背后原因可能不止你看到的这些
☞5G:新基建的压舱石,如何为新基建按下“加速键”?
☞中国人工智能市场破 50 亿!你还不了解 AI 云服务吗?
☞员工导致Twitter陷入史诗级加密黑客风暴?官方回应来了
点分享点点赞点在看
相关文章:

STL 队列queue
q.front() 返回队头元素 q.push(a) 将元素a入队 q.pop() 队头元素出队 q.empty() 如果队列为空 返回ture 否则返回false转载于:https://www.cnblogs.com/xujian9502/archive/2012/02/19/2358055.html

OpenCV——使用ROI进行图像切割
ROI(region of interest)——感兴趣区域。 1.用途 这个区域是图像分析所关注的重点。圈定这个区域,以便进行进一步的处理。而且,使用ROI指定 想读入的目标,可以减少处理时间,增加精度,给图像处理…

Asp.net动态生成html页面
作者:网际浪子专栏(曾用名littlehb) http://blog.csdn.net/littlehb/适用于:Microsoft ASP.NET 摘要:asp.net动态生成html页面,适用 简介 此功能适用于后台数据库功能不强的web站点,即大部分文本不是存放在数据库的…

View 5.1 重装上阵(4—基础架构篇)
从底层架构方面来看,VIEW 5.1最大的改进在于引入了Content-Based Read Cache(CBRC) 技术,大大降低了部署桌面虚拟化所带来的IOPS风暴,同时大大降低了对于存储的压力和成本,可谓桌面虚拟化领域的一大福音。 在以往的桌面虚拟化项目…
再见了,Python!!
结合我最近这些年的 Python 学习、开发经验,发现近90%的程序员在学 Python 时都会遇到下面这3个问题:1.想学Python,但不知从何学起,应用方向太多了也不知道该选择什么方向...2.基础入门看似简单,但是进阶实战就举步维艰…

alert在asp.net中如何使用??
改成这样:string str"<script languagejavascript>alert(省局数据不能进行修改!);</script>";Page.RegisterStartupScript("dd",str); 提示成功后转到别的页面Response.Write("<script>window.alert(提示语…

.NET工程师必须掌握的知识点
以下内容是转载的 Microsoft SQL Server 数据库 一、创建和维护数据库 1、数据库 SQL Server 数据库的组成部分?(参见联机丛书) 如何保证数据库的完整性、安全性、并发性? 数据库设计创建步骤?(参见…
@程序员:这些瓜没吃到,可以告别互联网了!
最近,程序员届有一个重大好消息,可能很多人还不知道,那就是:国内某些城市已经开始程序员人才补贴了!对于人工智能公司的项目开发、人才引进、科技研发,最高按照国拨经费的30%给予配套支持,单个项…

日志分析工具splunt
实验环境 网关 classroom 172.25.8.254 workstation 172.25.8.9 server a-jeth0 172.25.8.10-外网 eth1 192.168.0.x内网 eth2 192.168.1.x备用 -------------------------------------------- 需求: 设计: 原理:日志的作用,1&a…

正则表达式语法规则收集
turnmissile 的 Blog http://blog.csdn.net/turnmissile/ Microsoft已经把正则表达式的规则收录在了msdn里面了,有兴趣的朋友可以自己去研究一下(ms-help://MS.MSDNQTR.2003OCT.1033/cpgenref/html/cpconRegularExpressionsLanguageElements.htm),这里罗…
Python实现信息自动配对爬虫排版程序
作者 | 李秋键责编 | 晋兆雨头图 | CSDN付费下载自视觉中国在很多的公司项目中,常常有很多对office项目的比较机械化的操作,在这里就可以借助python实现对office的合理排版。而这里我们就将借助海尔公司的出货表爬取对应图片信息,并重新排版成…

关于2012年度土建工程专业中级专业技术资格考试有关问题的通知
关于2012年度土建工程专业中级专业技术资格考试有关问题的通知 现将2012年度土建工程专业初、中级专业技术资格考试、报名、培训工作有关事项通知如下: 一、考试组织 湖南省住房和城乡建设厅、省人力资源和社会保障厅联合成立领导小组,负责对考试工作进行…

Android自定义控件NumberCircleProgressBar(圆形进度条)的实现
Android自定义控件NumberCircleProgressBar(圆形进度条)的实现

做出的C++选择以及背后的原因
要让出资人明白你做出的C选择以及背后的原因。也许出资人会有更容易操作、更快实现的好主意。3、为你提供的日期说明信心范围。很可能管理层不明白你的估算意味着什么,而且你也有可能不理解他们所要的东西。 2.变量的C使用范围每个变量的使用范围只在定义…

拖放 DataGrid 列--来自MSDN
发布日期: 09/19/2004| 更新日期: 09/19/2004Chris SanoMicrosoft Corporation 摘要:了解如何利用基本的 GDI 功能,从而通过 DataGrid 控件获得可视化效果。通过跨越托管边界进行调用,可以利用本机 GDI 功能来执行屏幕…
最近很火的最新一代国际视频标准 VVC 到底是什么?阿里专家为你揭秘
作者 | 叶琰,阿里巴巴达摩院XG实验室视频标准团队负责人责编 | 夕颜头图 | CSDN付费下载自视觉中国2020年7月1日晚上(日内瓦时间),第十九次JVET会议在线上落下帷幕,新一代国际视频编码标准VVC第一版(Versat…

nesC编程入门
1.接口 NesC程序主要由各式组件(component)构成,组件和组件之间通过特定的接口(interface)互相沟通。一个接口内声明了提供相关服务的方法(C语言函数)。例如数据读取接口(Read&#…

用asp.net实现的把本文推荐给好友功能
作者: 飞鹰 www.ASPCool.com 时间:2001-11-25 17:39:07 ///<summary> ///<author>飞鹰ASPCool.com</author> ///<description>本文用asp.net实现把此文推荐给好友的功能。</desciption> ///<copyright>ASP酷技术资讯…

Access sql语句创建表及字段类型
创建一张空表: Sql"Create TABLE [表名]" 创建一张有字段的表: Sql"Create TABLE [表名]([字段名1] MEMO NOT NULL, [字段名2] MEMO, [字段名3] COUNTER NOT NULL, [字段名4] DATETIME, [字段名5] TEXT(200), [字段名6] TEXT(200)) 字段类…
“刚毕业1年,做Python能挣多少?”网友:吹的不多..
01现状揭秘:Python的火持续燃烧程序员:心态崩了!2020年转眼已经大半,在近几个月的榜单中,Python已经连续走上卫冕的道路,并且与Java的差距拉得更远了一些。以往与Java常呈现你追我赶之势,而这一…

Java编程的逻辑 (39) - 剖析LinkedList
本系列文章经补充和完善,已修订整理成书《Java编程的逻辑》,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http://it…

运用.NET读写Windows注册编辑表
作者: 冉林仓 www.ASPCool.com 时间:2001-11-9 如果你曾经使用过RegOpenKeyEx、RegCreateKeyEx、RegCloseKey等Win32 API函数读写过注册编辑表,你肯定非常熟悉这些复杂的Registry函数。相反,在.NET框架中,Registry和RegistryK…

使用正则表达式抽取新闻/BBS网页发表时间
package org.apache.nutch.parse.html; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * 分析时间戳 * * author xum * */ public class Publish…
为什么Python没有main函数?
作者 | 豌豆花下猫来源 | Python猫(ID:python_cat)众所周知,Python中没有所谓的main函数,但是网上经常有文章提到“ Python的main函数”和“建议编写main函数”。其实,可能他们是想模仿真正的main函数,但是…

HTTP访问服务的相关解释
一、访问网站的基本流程第一步:客户端用户在浏览器输入www.51cto.com网站,回车后,系统首先会查找系统本地的DNS缓存及hosts文件信息,确定是否存在www.51cto.com余名对应的IP解析记录,如果有就直接获取IP地址࿰…

关于ASP.Net中的时间处理
作者: 飞刀 www.ASPCool.com 时间:2001-8-8 这里我想谈谈ASP.Net中对时间的处理 在ASP.Net中,M$为我们提供一种名为DateTime的对象,我们用这个对象来取得当前的时间。比如: DateTime dtDateTime.Now; 在上面…
还缺30万人!程序员2020年要过好日子了……
最近,程序员届有一个重大好消息,可能很多人还不知道,那就是:国内某些城市已经开始程序员人才补贴了!对于人工智能公司的项目开发、人才引进、科技研发,最高按照国拨经费的30%给予配套支持,单个项…

淘宝海量数据库之二:一致性选择
众所周知,一致性是数据最关键的属性之一。2000年,Eric Brewer教授在ACM分布式计算年会上指出了著名的CAP理论: Brewer, E. A. 2000. Towards robust distributed systems. In Proceedings of the 19th Annual ACM Symposium on Principles of…

Linux 小记录!
rmdir与 rm -r 的不同处前者这能删除目录 后者目录和文件都可以删除cp 和echo 都会覆盖原有的内容ctrl + c 强制中断这条命令/前后是没有空格的快捷键:TAB 命令 路径补全符号:; 多个命令的分隔符/ 根或者路径的分隔符。> 标准输出重定向…

Session 详解
作者: heallven www.ASPCool.com 时间:2004-8-28 阅读本文章之前的准备 阅读本文章前,需要读者对以下知识有所了解。否则,阅读过程中会在相应的内容上遇到不同程度的问题。 懂得ASP/ASP.NET编程 了解ASP/ASP.NET的S…