当前位置: 首页 > 编程日记 > 正文

那些打着AI万金油旗号的产品欺骗大众,如何识别?

作者 | Arvind Narayanan

译者 | 刘畅

出品 | AI科技大本营(ID:rgznai100)


如今,很多打着AI名号售出的产品都属于万金油系列,没什么实质性的功能。为什么会这样?我们应该如何识别这类AI?


幻灯片上是评估性格和工作合适性的30秒视频

数以百万计的求职者已经接受了这类算法的评估。上图是来自某家公司的促销视频截图。这些系统声称甚至不用理会应聘者说的内容,根据肢体语言和语音就可以分析一个应聘者。

基本常识会告诉我们这不可能,但是AI专家会说这是可能的。而实际上这个产品只是一个精心制作的随机数生成器。

       

这些公司筹集了数亿美元,并且积极的占领客户。伪造AI来筛选求职者的现象变得越来越严重。这张PPT显示了该问题有多严重,其中的表格来自https://arxiv.org/abs/1906.09208

人们正在学习如何利用这些虚假系统来工作,并在社交媒体上分享一些恐怖的故事

这为什么会发生?为什么人事部门如此容易受欺骗?除了雇佣,其它哪些领域还有打着AI旗号的万金油工具?

       

以上是作者的关于为什么有如此多的AI万金油工具,以及为什么决策者会被它们欺骗的假设。

例如,AlphaGo是一项非凡的成就,并且值得称赞。大多数专家都没想到这种可能。

但是,它与声称可以预测工作绩效的工具之间,却大相径庭。

媒体大肆宣传公司可以将AI作为解决所有问题的解决方案。因此,美国公众认为,所有工种的自动化仅10年之遥!

如果决策者认为这种根本性变革即将到来,请想象一下它将如何扭曲我们正在进行的优先事项。我相信在如今社会这实际上是正在发生的。

请注意,AI专家对人工智能或强AI的预测距离尚有50多年之久,但是历史告诉我们,即使是专家,也往往对AI的发展太乐观了。

让我们更具体一点。我将把AI应用程序分为三类(并非详尽无遗)。

这张幻灯片上的所有内容都是一个识别问题(Deepfakes并不是纯粹的识别而是紧密相关的。它们是使用生成对抗网络来实现的)。识别是人工智能快速发展的几个领域之一。

在这张幻灯片上的所有任务中,AI都已经达到或超过了人类的准确性,并且正在不断迅速提高。

取得进展的根本原因是,这些任务没有不确定性或模棱两可。给定两张图像,关于它们是否代表同一个人是有一个基本事实。因此,如果有足够的数据和计算能力,人工智能能够学到将一张脸与另一张脸区分开的模式。人脸识别存在一些明显的失败,但是我很高兴地预测它将能变得更加准确(不过这也正是我们应该担心的原因)。

第二类是关于尝试自主判别的应用程序。人的思维是具有启发性的,例如什么是垃圾邮件,而不是垃圾邮件,并且给出足够的例子。机器会尝试去学习它。

在这些任务上,人工智能将永远是不完美的,因为它们涉及判别力,并且理性的人可能会不同意正确的决定。

我们似乎已经准备部署这些系统,并且必须决定如何最好地管理它们,例如为被错删内容的人们找出适当的程序机制。

我将把剩下的话题集中在第三类,那里有大量的万金油。

上面已经展示了声称可以预测工作适合程度的工具。类似的,基于惯犯的算法来预测保释金的多少。人们使用算法去分析社交媒体帖子并预测恐怖分子的危险程度,因而被拒之门外。

这些问题很难解决,因为我们无法预测未来。而这些应该是常识。但在涉及AI时,我们似乎已经决定忘记常识。

当然,这甚至与AI所面向的事物(如机器人技术)都不相近。但,要点是说明对于不同类型的任务,数据的数量和质量对精度的限制上是如何不同的。

接下来将展示,无论你投入多少数据,第三类应用不会有真正的改善。

我知道这是一次衡量社会结果可预测性,非常严格的尝试。

他们根据深入访谈和多年来多次重复进行的家庭观察收集了有关每个孩子和家庭的大量数据。

他们使用了与许多其他机器学习竞赛相似的挑战环境。

任务是根据训练实例学习背景数据和结果数据之间的关系。比赛期间在排行榜上评估准确性,比赛结束后根据保留的数据评估准确性。

完美预测对应于R^2为1。预测每个实例的均值对应于R^2为0(即,该模型完全没有学会区分实例)。

大多数人的直觉似乎都认为R^2的值在0.5到0.8之间。并且组织竞赛的许多专家都寄予厚望。

这是实际发生的情况。

记住:数百名AI / ML研究人员和学生尝试过这样做,他们需要最大限度地提高预测准确性,每个家庭都有13,000个特征。图上的是表现最好的模型。

这就是问题所在。

回归分析已有一百年历史了。

在许多领域都有相同的发现。

请注意,上图所示是准确度,而不是R^2,因此65%仅比随机数略好。

实际准确性可能更低,这是因为虽然该工具声称可以预测累犯,但实际上是能预测重新逮捕,因为这就是数据中记录的内容。因此,至少算法的某些预测性能来自预测策略的偏差。

这是个人的意见。当然,如果发现相反的证据,我愿意改变主意。但是,鉴于目前的证据,这似乎是最谨慎的看法。

驾照的欠费可以被视为预测事故风险的一种方式。一些研究发现此类系统可以进行合理的使用。

很长时间以来,我们就知道,如果我们真正想做的只是预测,那么简单的公式比人类的预测更准确, 甚至是经过多年训练的专家。丹尼尔·卡尼曼(Daniel Kahneman)解释说,这是因为人类的预测往往“太多杂念”:如果输入相同,则不同的人(甚至在同一时间的同一个人)将做出非常不同的预测。而使用统计公式则可以消除这种不同。

与人工评分规则相比,使用AI进行预测有许多缺点。也许最重要的是缺乏可解释性。想象一下这样一个系统,在该系统中,每次您被警务人员拦下时,警务人员都会将您的数据输入计算机,这并不像驾照上的积分。大多数情况下,您可以免费离开,但是在某些时候,黑匣子系统会告诉您不再允许被开车。

不幸的是,实际上如今我们在许多领域都拥有这种系统。

来源:

https://www.cs.princeton.edu/~arvindn/talks/MIT-STS-AI-snakeoil.pdf

(*本文为AI科技大本营编译文章,转载请微信联系 1092722531)

精彩公开课

推荐阅读

  • 2020大数据十大趋势发布!华为、阿里、滴滴、百度、京东、讯飞等顶尖专家齐聚BDTC

  • 蚂蚁金服提新概率图模型GLN,正确率提升8.2%,具备可解释性 | NeurIPS 2019

  • 远场语音识别错误率降低30%,百度提基于复数CNN网络的新技术

  • 微软张若非:搜索引擎和广告系统,那些你所不知的AI落地技术

    基于人脸关键点修复人脸,腾讯等提出优于SOTA的LaFIn生成网络

  • 从YARN迁移到k8s,滴滴机器学习平台二次开发是这样做的

  • 劳荣枝潜逃23年落网,多亏了它

  • 实例分析+ 实践步骤,手把手教你编写以太坊、EOS智能合约!

  • 2020年,区块链开发者还有哪些期待?

  • 云计算管理工具:根植热土

  • 你点的每个“在看”,我都认真当成了AI

相关文章:

分享一款jQuery全屏滚动页面特性案例

分享一款jQuery全屏滚动页面特性案例。我们在来往官网,或者小米官网都会看到全屏滚动页面的一些例子。可以说全屏滚动页面越来越受欢迎。它们就像是竖着的图片轮转一样。这样的页面有很多,如:iPhone 5C页面:http://www.dowebok.co…

后深度学习时代的一大研究热点?论因果关系及其构建思路

作者 | Bernhard Schlkopf译者 | Kolen编辑 | Jane出品 | AI科技大本营(ID:rgznai100)尽管机器学习在现阶段取得了很大成功,但是相比于动物所能完成的工作,机器学习在动物擅长的关键技术上表现不尽人意,比如…

Java观察者模式

当对象间存在一对多关系时,则使用观察者模式(Observer Pattern)。比如,当一个对象被修改时,则会自动通知它的依赖对象。观察者模式属于行为型模式。 意图:定义对象间的一种一对多的依赖关系,当一…

Python3中None用法

1.None是一个空值,空值是Python里的一个特殊值,用None表示。可以将None赋值给任何变量。 var None; print(var) # None if var is None:print("var has a value of None") # print else:print("var:", var) 2.None有自己的数据类型…

try finally 中的return

2019独角兽企业重金招聘Python工程师标准>>> public class Test { public static int test1() { int x 1; try { return x; } finally { x; } } public static int test2() { int x 1; try { return x; } finally { return x; } } public st…

我用Python破解了同事的加密压缩包

作者 | 朱小五来源 | 凹凸玩数据(ID: alltodata)又是一杯奶茶。事情的经过是这样的:又是奶茶,行吧行吧。快点开工,争取李大伟回来之前搞定。李大伟说是6位数字密码那么我们可以利用python生成全部的六位数字密码#生成从…

Ubuntu上通过android toolchain交叉编译Valgrind操作步骤

关于Valgrind的介绍可以参考:https://blog.csdn.net/fengbingchun/article/details/50196189. 这里介绍下在Ubuntu 16.04上通过android toolchain如android-ndk-r14b交叉编译Valgrind源码的操作步骤: 1. 从 https://valgrind.org/ 下载最新的版本3.17.0&…

Java状态模式

在状态模式(State Pattern)中,类的行为是基于它的状态改变的。这种类型的设计模式属于行为型模式。 在状态模式中,我们创建表示各种状态的对象和一个行为随着状态对象改变而改变的 context 对象。 意图:允许对象在内部…

Red Hat 5.8 CentOS 6.5 共用 输入法

pick up from http://jingyan.baidu.com/article/20b68a885a3607796cec622c.html

Python3中with用法

Python中的with语句用于用上下文管理器(context manager)定义的方法包装块的执行,它允许将常见的try…except…finally使用模式封装起来以方便重用。 在Python中,在处理非托管资源(unmanaged resources)(如文件流)时使用with关键字。它允许确保你在使用资…

作为计算机专业的你,这些点你命中了哪些?

是不是学计算机的在别人眼里就得会修电脑?是不是编代码的程序员在别人眼里就得喜欢穿格子衫?是不是从事互联网行业的人在别人眼里就喜欢背双肩包出行?1我学计算机就得会修电脑?前两天我在加班的时候,电话突然响起&…

Java空对象模式

在空对象模式(Null Object Pattern)中,一个空对象取代 NULL 对象实例的检查。Null 对象不是检查空值,而是反应一个不做任何动作的关系。这样的 Null 对象也可以在数据不可用的时候提供默认的行为。 在空对象模式中,我们…

JSON入门基础知识

2019独角兽企业重金招聘Python工程师标准>>> JSON入门基础 1、JSON定义 JSON:JavaScript 对象表示法(JavaScript Object Notation)。 JSON 是存储和交换文本信息的语法。类似 XML。 JSON 比 XML 更小、更快,更易…

Python3中raise用法

Python中raise语句支持强制触发指定的异常。 raise语法: raise [EXPRESSION [from EXPRESSION]] 如果raise后未跟表达式(expression),则raise重新引发当前作用域中活动的最后一个异常。如果当前范围内没有异常处于活动状态,则会引发RuntimeE…

精选实践 | 爱奇艺实用数据库选型树:不同场景如何快速选择数据库?

作者 | 郭磊涛 爱奇艺数据库和中间件负责人 TiDB User Group Ambassador来源 | 授权转载自AskTUG本文系 TUG 线下活动 “不同业务场景下的数据库技术选型思路” 分享实录。我是爱奇艺的数据库和中间件负责人郭磊涛,今天主要向大家分享数据库选型方面的思路&#xff…

iOS处理高并发量的数据请求和数据集合的对应关系

一、处理高并发请求的核心代码如下: // 创建信号量dispatch_semaphore_t semaphore dispatch_semaphore_create(0);// 创建全局并行dispatch_queue_t queue dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_DEFAULT, 0);dispatch_group_t group dispatch_gro…

Top 10 Mistakes Java Developers Make(转)

文章列出了Java开发者最常犯的是个错误。 1.将数组转换为ArrayList 为了将数组转换为ArrayList&#xff0c;开发者经常会这样做&#xff1a; ?1List<String> list Arrays.asList(arr);Arrays.asList()会返回一个ArrayList&#xff0c;但这个ArrayList是Arrays的私有静态…

Python3中迭代器介绍

Python中一个可迭代对象(iterable object)是一个实现了__iter__方法的对象&#xff0c;它应该返回一个迭代器对象(iterator object)。迭代器是一个实现__next__方法的对象&#xff0c;它应该返回它的可迭代对象的下一个元素&#xff0c;并在没有可用元素时触发StopIteration异常…

30+博士、100+硕士整理的超全深度强化学习资源清单

作者 | Deep-RL来源 | 深度强化学习实验室&#xff08;ID&#xff1a;Deep-RL&#xff09;今天为大家推荐一个开源、开发的 Github 好项目《A Guide for Deep Reinforcement Learning》。这个项目联合了Deep Reinforcement Learning领域的30位博士&#xff0c;100位硕士共同完成…

Java访问者模式

在访问者模式&#xff08;Visitor Pattern&#xff09;中&#xff0c;我们使用了一个访问者类&#xff0c;它改变了元素类的执行算法。通过这种方式&#xff0c;元素的执行算法可以随着访问者改变而改变。这种类型的设计模式属于行为型模式。根据模式&#xff0c;元素对象已接受…

GNU/Linux平台上正则表达式的简单使用

友情提醒&#xff1a;本博文涉及的内容中涉及到的系统实践操作在Centos6.5上实现,GNU/Linux简称为linux&#xff0c;GNU/grep简称为grep&#xff0c;GNU/sed简称为sed&#xff0c;GNU/gawk简称为awk。-------------------------------------------------楔子------------------…

Linux下addr2line命令用法

Linux下addr2line命令用于将程序指令地址转换为所对应的函数名、以及函数所在的源文件名和行号。当含有调试信息(-g)的执行程序出现crash时(core dumped)&#xff0c;可使用addr2line命令快速定位出错的位置。 如果无法确定文件名或函数名&#xff0c;addr2line将在它们的位置打…

JavaMVC 模式

MVC 模式代表 Model-View-Controller&#xff08;模型-视图-控制器&#xff09; 模式。这种模式用于应用程序的分层开发。 Model&#xff08;模型&#xff09; - 模型代表一个存取数据的对象或 JAVA POJO。它也可以带有逻辑&#xff0c;在数据变化时更新控制器。View&#xff0…

从概念到技术,打通「中台」的任督二脉,别再说不知道中台是什么

2019 年&#xff0c;「中台」这个词火了&#xff01;随着阿里等头部互联网企业搭建和推动中台业务&#xff0c;让越来越多的企业关注中台&#xff0c;纷纷提出「中台战略」&#xff0c;帮助企业自身加速实现数字化转型。不少企业还在观望「中台」&#xff1a;1、我的企业里需要…

php中序列化与反序列化

http://www.cnblogs.com/A-Song/archive/2011/12/13/2285619.html 转自&#xff1a;http://qing.weibo.com/tag/unserialize 把复杂的数据类型压缩到一个字符串中 serialize() 把变量和它们的值编码成文本形式unserialize() 恢复原先变量eg:$stooges array(Moe,Larry,Curly);$…

Python3中生成器介绍

生成器(generator)&#xff1a;一个返回生成器迭代器的函数。它看起来像一个普通函数&#xff0c;除了它包含用于生成一系列可在for循环中使用的值的yield表达式或者可以使用next函数一次检索一个值。 在Python中&#xff0c;使用了yield的函数被称为生成器。跟普通函数不同的是…

数学学渣必备!拍照上传,分步求解,微软解题神器拯救你

整理 | Jane出品 | AI科技大本营&#xff08;ID&#xff1a;rgznai100&#xff09;在学好数学这条路上&#xff0c;很多同志前赴后继「死伤无数」&#xff0c;即便大家不断的寻求「场外救援」&#xff0c;可最终都逃不过一个字&#xff1a;难&#xff01;两个字&#xff1a;真难…

Java业务代表模式

业务代表模式&#xff08;Business Delegate Pattern&#xff09;用于对表示层和业务层解耦。它基本上是用来减少通信或对表示层代码中的业务层代码的远程查询功能。在业务层中我们有以下实体。 客户端&#xff08;Client&#xff09; - 表示层代码可以是 JSP、servlet 或 UI j…

在wamp环境下面安装Zend Optimizer的方法

我是用WAMP来做PHP的服务器&#xff0c;进行本机测试和开发PHP项目。 wamp环境是刚刚安装的。由于这个项目的代码是zend加密的&#xff0c;运行时候都是乱码&#xff0c;需要安装一个Zend Optimizer配置。 首先下载一个Zend Optimizer软件。 1、进入安装界面后&#xff0c;按NE…

libuvc介绍及简单使用

libuvc是一个用于USB视频设备的跨平台库&#xff0c;构建在libusb之上&#xff0c;编译libuvc时需要依赖libusb。libuvc的License为BSD&#xff0c;最新发布版本为0.0.6&#xff0c;源码地址: https://github.com/libuvc/libuvc libuvc支持在非windows系统上直接编译&#xff0…