图灵奖得主Bengio再次警示:可解释因果关系是深度学习发展的当务之急
(图片付费下载自视觉中国)
作者 | Will Knight
译者 | Monanfei
来源 | Wired
出品 | AI科技大本营(ID:rgznai100)
深度学习擅长在大量数据中寻找模式,但无法解释它们之间的关系。图灵奖获得者 Yoshua Bengio 希望改变这一状况。
今年三月,Yoshua Bengio
他为深度学习领域的发展做出了杰出的贡献:研究了触发人工智能复兴的技术,引领了无人驾驶技术,实时语音翻译和面部识别技术的进步。而现在,Bengio 认为深度学习需要被进一步挖掘。他认为,除非深度学习能够超越模式识别并了解因果关系的更多信息,否则它将无法实现其全部潜力,也不会带来真正的AI革命。换句话说,深度学习需要开始知道事情发生的因果关系。
这位
Bengio 认为,将因果关系集成到 AI 中是一件大事,当前的机器学习方法都假设经过训练的 AI 系统将应用于与训练数据相同类型的数据上。然而,在现实生活中,情况往往并非如此。包括深度学习在内的机器学习系统是高度定制的,它们针对特定任务进行了训练,例如识别图像中的猫或音频中的口头命令等。自 2012 年左右问世以来,深度学习已展现出了卓越的模式识别能力。它已被用于许多实际用途,例如在医学扫描中发现癌症迹象,以及发现财务数据欺诈等。
但深度学习从根本上对因果关系是盲目的。与真正的医生不同,深度学习算法无法解释为什么特定图像可能存在疾病隐患。这意味着在危急情况下,我们必须谨慎使用深度学习。
了解因果关系将使现有的 AI 系统更加智能,更加高效。以自动驾驶汽车为例,Bengio 认为,人类无需经历很多事故案例就可以谨慎驾驶,因为人类可以想象事故,以便为发生的实际情况做好心理准备。但是机器不能,因此如何赋予AI系统这种能力,是我们真正应该关心的。
现如今,在 Bengio 的实验室里,他正在研究一种能够识别简单因果关系的深度学习算法。
他们使用了一个数据集,以概率的形式绘制了诸如吸烟和肺癌等现实世界现象之间的因果关系。他们还生成了因果关系的综合数据集。该算法本质上形成了关于哪些变量具有因果关系的假设,然后测试了对于不同变量的更改如何符合该假设。例如,我们知道吸烟不仅与癌症有关,还会导致癌症,即使癌症与其他因素(例如医院就诊)相关,这个事实也应该显而易见。
机器人最终可能会使用这种方法来形成一种假设:当物体掉落时会发生些什么。然后在看到几件东西掉在地板上后,机器人再去确认其直觉。
Bengio 已经参与了一次 AI 技术革新。在过去的几十年中,他与今年的其他图灵奖获得者:多伦多大学教授 Geoffrey Hinton以及在纽约大学和 Facebook 工作的 Yann LeCun一起,帮助开发了释放深度学习潜力的思想和技术。
使用人工神经网络通过构建和加强联系,深度学习从数学上近似了人类神经元和突触的学习方式。训练数据(例如图像或音频)被馈送到神经网络,神经网络会逐渐进行调整,直到以正确的方式做出响应为止。只要能够看到很多训练图像并具有足够的计算能力,就可以训练深度学习程序,从而准确地识别照片中的对象。
但是深度学习算法并不善于概括,也不善于将它们从一个上下文中学到的东西应用到另一个上下文中。它们能够捕获相关的现象,例如公鸡啼叫和太阳升起,但是无法考虑彼此之间的因果关系。
因果关系已在其他领域进行了长期研究,近几十年来出现了许多探索因果关系的数学技术,从而帮助彻底改变了包括社会科学、经济学和流行病学在内的各个领域的研究。一小群研究人员正在努力将因果关系和机器学习结合起来。
Judea Pearl 因为因果关系推理的工作而获得了 2011 年的图灵奖,Pearl 参与合著的新书《因果之书:因果关系的新科学》(The Book of Why: The New Science of Cause and Effect)讲到,如果没有某种因果推理的能力,人工智能将从根本上受到限制。
此外,认知科学实验还表明,理解因果关系是人类发展和智力的基础,尽管我们尚不清楚人类是如何形成这种知识的。
Bengio 关于因果关系的工作可能是回答这一问题的契机,但它也反映了深度学习更多现实的方面。即使随着深度学习技术的应用成倍增加,越来越多的专家指出,该技术在诸如语言理解之类的关键领域中存在局限性。
在采访中,Bengio 对公司如何夸大 AI 和深度学习的能力表示很沮丧。他认为,如果商业世界能够进行一些修正,那将是一件好事,因为商业炒作目前过于夸大其词了。
其他人则认为,专注于深度学习可能只是问题的一部分。纽约大学名誉教授 Gary Marcus最近出版的《重新引导 AI:建立我们可以信任的人工智能》( Rebooting AI: Building Artificial Intelligence We Can Trust)表示,Bengio 对因果推理的兴趣预示着深度学习领域思维的可喜变化。
认为,太多的深度学习侧重于没有因果关系的关联性,这常常使深度学习系统在真实条件下进行测试时不尽人意。他认为,来自人类经验的教训是显而易见的,当孩子询问为什么的时候,他们正在探索因果关系,因此当机器开始问为什么的时候,它们会变得更加聪明。
原文链接:
https://www.wired.com/story/ai-pioneer-algorithms-understand-why/
◆
精彩推荐
◆
推荐阅读
简单粗暴上手TensorFlow 2.0,北大学霸力作,必须人手一册
分析Booking的150种机器学习模型,我总结了6条教训
微软也爱Python:VS Code Python全新发布!Jupyter Notebook原生支持终于来了
如何保护你的Python代码(一)——现有加密方案
罗永浩向老同事道歉;三星漏洞已波及四千万用户;Clojure 1.11 即将发布 | 极客头条
真·上天!NASA招聘区块链"多功能复合型"人才, 欲保护飞行数据安全……
10 月全国程序员工资统计,一半以上的职位 5 个月没招到人
【光说不练假把式】今天说一说Kubernetes 在有赞的实践

你点的每个“在看”,我都认真当成了喜欢
相关文章:

解决jQuery不同版同时引用的冲突
今天研发的同事在开发一个新jQuery插件时,遇到一个揪心的问题。平台以前使用的 jQuery版本是1.2.6,偶,天啊!这是古代的版本啊! 由于很多功能基于老版本,不能删除啊,同志们都懂的! 于…

TensorFlow中的计算图
作者 | stephenDC来源 | 大数据与人工智能(ID:ai-big-data)1 什么是计算图?一个机器学习任务的核心是模型的定义以及模型的参数求解方式,对这两者进行抽象之后,可以确定一个唯一的计算逻辑,将这个逻辑用图表…

java设计模式-适配器模式
模式导读: 每个人都有自己不同的需要,每个人都有自己能够接受的不同方式,就像是为满足现在快速度发展的社会,几乎人人离不开手机的时代,我们也许会碰到在外出行手机电量不足的情况,这个时候如果你在车站,你…
Ubuntu 14.04 64位上安装Valgrind 3.13.0 操作步骤
关于Valgrind的介绍和使用可以参考: http://blog.csdn.net/fengbingchun/article/details/50196189 在Ubuntu 14.04上可以通过以下命令直接安装Valgrind,直接通过命令安装的版本是3.10.1,如下图,有些较老,目前最新版本…

粗谈Android中的对齐
在谈这个之前先啰嗦几个概念。 基线:书写英语单词时为了规范书写会设有四条线,从上至下第三条就是基线。基线对齐主要是为了两个控件中显示的英文单词的基线对齐,如下所示: Start:在看API的时候经常会有Start对齐&…
OpenCV3.3中逻辑回归(Logistic Regression)使用举例
OpenCV3.3中给出了逻辑回归(logistic regression)的实现,即cv::ml::LogisticRegression类,类的声明在include/opencv2/ml.hpp文件中,实现在modules/ml/src/lr.cpp文件中,它既支持两分类,也支持多分类,其中:…

多数编程语言里的0.1+0.2≠0.3?
作者 | Parul Malhotra译者 | Raku出品 | AI科技大本营(ID:rgznai100)我们从小就被教导说0.10.20.3,但是在奇妙的计算机编程世界里面,事情变得不一样了。我最近在用JavaScript编程,正在阅读数据类型的时候,…

iOSSharing #9 | 2019-05-19
目录 1. setNeedsLayout、layoutIfNeeded与layoutSubviews区别? 2. UIView与CALayer的区别? 3. loadView什么时候被调用?它有什么作用?默认实现是怎么样的? 4. UIViewController的完整生命周期? 5. UIView动…

分表处理(三)
一、概述分表是个目前算是比较炒的比较流行的概念,特别是在大负载的情况下,分表是一个良好分散数据库压力的好方法。首先要了解为什么要分表,分表的好处是什么。我们先来大概了解以下一个数据库执行SQL的过程:接收到SQL –> 放…
逻辑回归(Logistic Regression)简介及C++实现
逻辑回归(Logistic Regression):该模型用于分类而非回归,可以使用logistic sigmoid函数( 可参考:http://blog.csdn.net/fengbingchun/article/details/73848734 )将线性函数的输出压缩进区间(0,1): p(y1| x;θ)σ(θTx).逻辑回归是…

CVPR 2019论文阅读:Libra R-CNN如何解决不平衡对检测性能的影响?
作者 | 路一直都在出品 | AI科技大本营(ID:rgznai100)Paper link:https://arxiv.org/pdf/1904.02701.pdfCode link:https://github.com/OceanPang/Libra_R-CNNAbstract在目标检测中,人们更关注的往往是模型结构&#x…

实现nginx上配置免费证书Let's Encrypt
Lets Encrypt 的免费证书有效期为三个月,不过可以免费续期,写一个脚本定期更新即可。 准备一台nginx 服务器 ,将以下三个附件上传到你的nginx服务器。 1、下载脚本文件,wget https://raw.githubusercontent.com/xdtianyu/scripts/…

深入解析Windows操作系统笔记——CH1概念和术语
1.概念和工具 本章主要介绍Windows操作系统的关键概念和术语 1.概念和工具... 1 1.1操作系统版本... 1 1.2基础概念和术语... 2 1.2.1Windows API2 1.2.2 服务、函数和例程... 3 1.2.3 进程、线程和作业... 4 1.2.3.1 进程... 4 1.2.3.2 线程... 4 1.2.3.3 虚拟地址描述符... 4…
C++/C++11中std::exception的使用
std::exception:标准异常类的基类,其类的声明在头文件<exception>中。所有标准库的异常类均继承于此类,因此通过引用类型可以捕获所有标准异常。 std::exception类定义了无参构造函数、拷贝构造函数、拷贝赋值运算符、一个虚析构函数和…

技术不错的程序员,为何面试却“屡战屡败”
为何很多有不少编程经验,技术能力不错的程序员,去心仪公司面试时却总是失败?至于失败的原因,可能很多人都没意识到过。01想要通关面试,千万别让数据结构拖了后腿很多公司,比如 BAT、Google、Facebook&#…

FastJson 转换 javaBean 时 null 值被忽略都问题
[toc] 问题 当 JavaeBean 中某个属性值为 null 时,转换为 JSONObject 对象或者 json 字符串时,该属性值被忽略。如何让不管值是否为 null,转化后该属性还存在,只是值为 null。 情况演示 class St {private String sid;private Str…

来玩Play框架07 静态文件
作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! Play框架的主要功能是提供动态响应的内容。但一个网络项目中必然有大量的静态内容,比如图片、Javascript文件、CSS文件等。我下面介绍…
C++/C++11中std::runtime_error的使用
std::runtime_error:运行时错误异常类,只有在运行时才能检测到的错误,继承于std::exception,它的声明在头文件<stdexcept>中。std::runtime_error也用作几个运行时错误异常的基类,包括std::range_error(生成的结…

估值被砍700亿美元后,Waymo发重磅公开信:即将推出全自动驾驶打车服务
(图片源自 Waymo 官网)编译 | 夕颜出品 | AI科技大本营(ID:rgznai100)近日,据 Reddit 盛传的一封电子邮件副本显示,Alphabet 旗下的自动驾驶汽车公司 Waymo 已经向其自动驾驶服务的用户发送了一封电子邮件&…

Swoft 2 Beta 发布,基于 Swoole 的云原生协程框架
Swoft 是首个基于 Swoole 原生协程的框架,从开发到发布据今已有2年多。 1.x 发布以来,已有大量的开发人员和企业使用,得到了大家的认可。从去年11月份开始,将近半年的时间从零开始,底层吸取之前经验,基于 S…

Linux中源码包的管理
什么是开放源码,编译程序和可执行文件开放源码:就是程序代码,写给人类看的程序语言,但机器不认识,所以无法执行;编译程序:将程序代码转译成为机器看得懂的语言;可执行文件:经过编译程序变成二进制程序后,机…
支持向量机(SVM)简介
支持向量机(support vector machine, SVM):是监督学习中最有影响力的方法之一。类似于逻辑回归,这个模型也是基于线性函数wTxb的。不同于逻辑回归的是,支持向量机不输出概率,只输出类别。当wTxb为正时,支持向量机预测属…

首届中文NL2SQL挑战赛:千支队伍参赛,国防科大夺冠
(图片由AI科技大本营付费下载自视觉中国)整理 | Jane出品 | AI科技大本营(ID:rgznai100)【导语】10月12日,追一科技主办的首届中文NL2SQL挑战赛在激烈的决赛中落下帷幕,冠军由国防科技大学学生组…

怎么使用CAD编辑器来打开图纸中的所有图层
在CAD绘图中,建筑设计师们不仅要对CAD图纸进行编辑,还要对CAD图纸进行查看,一张图纸中是有许多图层的,那在查看的过程中有的时候把其他的图层进行隐藏了,那如果想要把隐藏的CAD图层进行打开要怎么操作?如何…

域名年龄-SEO搜索引擎优化
为什么80%的码农都做不了架构师?>>> 域名年龄-SEO搜索引擎优化 在我们创建一个新的网站时,我们首先考虑到的是去注册一个新的域名。 有时发现我们 要注册的域名已经被注册了,于是就有两种方式: 一、重新注册另外的…
log库spdlog简介及使用
spdlog是一个开源的、快速的、仅有头文件的C11 日志库,code地址在 https://github.com/gabime/spdlog ,目前最新的发布版本为0.14.0。它提供了向流、标准输出、文件、系统日志、调试器等目标输出日志的能力。它支持的平台包括Windows、Linux、Mac、Andro…

多模态人物识别技术及其在视频场景中的应用 | CSDN技术公开课
不用倍速播放,还有什么功能可以让你高效追剧?爱奇艺的「只看TA」了解一下?而这个功能背后离不开多模态人物识别技术的支撑。识别视频中的人物涉及哪些信息?只有人脸识别就足够了吗?其实不然,这样一个看似简…

研究人员测试27个黑客服务 结果仅三个完成任务
现代电子邮件帐户不仅是一个电子邮件地址,它还是人们在网络上的身份的基础,可用于申请各种网络服务或重置服务密码,以便持有电子邮件的黑客服务帐户很受欢迎,为了了解这些服务的功能,谷歌和加州大学圣地亚哥分校的研究…

CIF、QCIF
分辨率: 每个像素的存储方式都是YUV QQCIF:88*72 QCIF:176*144 CIF:352*288 2CIF:704*288 DCIF:584*384 4CIF:704*576 QCIF: QCIF: Quarter Common Intermediate Format 英文缩写 qcif 英文全称 Quarter Common Intermediate Format 中文解释 四分之一通…
OpenCV3.3中支持向量机(Support Vector Machines, SVM)实现简介及使用
OpenCV 3.3中给出了支持向量机(Support Vector Machines)的实现,即cv::ml::SVM类,此类的声明在include/opencv2/ml.hpp文件中,实现在modules/ml/src/svm.cpp文件中,它既支持两分类,也支持多分类,还支持回归…