这是一个好问题:既然机器可以学习,它们能忘掉吗?
编译 | 禾木木
出品 | AI科技大本营(ID:rgznai100)
很多公司都使用机器学习来分析人们的欲望、厌恶或面孔。研究人员提出了一个不同的问题:我们如何让机器忘记学习?
机器学习正在寻找如何在人工智能软件中诱发选择性失忆的方法。目标是从机器学习系统中删除特定人员或数据点的所有痕迹,而不影响其性能。
如果该功能可以实现,这个概念可以更好地让人们控制他们的数据和产生的价值。尽管用户已经可以要求一些公司删除个人数据,但他们并不清楚算法是如何调整这些信息。机器忘掉学习却有可能让一个人撤回他们的数据和公司获利的方法。
该方法对于那些想删除网上分享的内容来说很直观,但人工健忘症的概念需要计算机科学方面的一些新想法。
你认为这个想法可以实现吗?
这些公司花费数百万美元训练机器学习算法来识别面孔或对社交帖子进行排名,算法比手动编码人员可以更快地解决问题。但一旦经过训练,机器学习系统就不会轻易改变,甚至不会被理解。消除特定数据点影响的传统方法是从头开始重建系统,这是一项代价高昂的工作。
宾夕法尼亚大学机器学习的教授亚伦罗斯表示“这项研究旨在找到一些中间立场,当他们要求删除数据时,我们能否消除他们数据的所有影响,同时避免从头开始重新训练的全部成本?”
机器取消学习的工作部分是由于人们关注到人工智能可能侵犯隐私的方式。长期以来,世界各地的数据监管机构都有权强制公司删除不良信息。例如欧盟和加利福尼亚州的公民,如果他们对披露的内容改变了主意,他们有权要求公司删除他们的数据。最近,美国和欧洲的监管机构表示,人工智能系统有时必须更进一步:删除针对敏感数据进行训练的系统。
“当他们要求删除数据时,我们能否消除他们数据的所有影响,同时避免从头开始重新训练的全部成本?”
去年,英国数据监管机构警告,一些机器学习软件可能会受到 GDPR 权利的约束,例如数据删除,因为 AI 系统可能包含个人数据。安全研究人员已经表明,算法有时会被迫泄露其创建中使用的敏感数据。今年年初,美国联邦贸易委员会迫使面部识别公司 Paravision 删除了一系列以不当方式获取的面部照片和用它们训练的机器学习算法。FTC 专员 Rohit Chopra 称赞这种新的执法策略是一种迫使违反数据规则的公司“丧失其欺骗成果”的方式。
取消机器学习研究的小领域正在努力解决这些监管转变带来的一些实际和数学问题。研究人员已经表明,他们可以让机器学习算法在某些条件下忘记,但该技术尚未准备好。
“对于一个年轻的领域来说很常见,这个领域渴望做的事情与我们现在知道如何做的事情之间存在差距,”罗斯说。
多伦多大学和威斯康星大学麦迪逊分校的研究人员在 2019 年时,提出了一种很有前景的方法是将新机器学习项目的源数据分成多个部分。单独处理每个,然后将结果组合到最终的机器学习模型中。如果需要忘记一个数据点,则只需重新处理原始输入数据的一小部分。该方法被证明适用于在线购买数据和超过一百万张照片的集合。
Roth 和来自宾夕法尼亚大学、哈佛大学和斯坦福大学的合作者最近证明了这种方法的一个缺陷,表明如果提交的删除请求以特定的顺序出现,无论是偶然的还是来自恶意行为者,学习系统都会崩溃。并且他们还展示了如何缓解这个问题。
滑铁卢大学教授 Gautam Kamath 也致力于取消学习,他说该项目发现并解决的问题是,关于如何使机器取消学习不仅仅是实验室好奇心的许多悬而未决的问题的一个例子。他自己的研究小组一直在探索通过连续取消学习多个数据点来降低系统准确性的程度。
Kamath 还对寻找方法让公司证明——或监管机构来检查——系统真的忘记了它应该忘记的东西。“感觉好像还有一段路要走,但也许他们最终会为这类事情配备审计员,”他说。
随着 FTC 和其他机构仔细研究算法的力量,调查解除机器学习可能性的监管理由可能会增加。牛津大学研究数据保护的教授鲁本·宾斯 (Reuben Binns) 表示,近年来在美国和欧洲,个人应该对其数据的命运和成果有发言权的观念越来越多。
在科技公司真正实施机器学习之前,需要精湛的技术工作,让人们更好地控制其数据的算法命运。即便如此,该技术可能不会对人工智能时代的隐私风险产生太大影响。
差分隐私是一种巧妙的技术,可以对系统泄漏的个人信息进行数学限制,提供了有用的比较。苹果、谷歌和微软都对这项技术赞不绝口,但使用相对较少,隐私风险仍然很多。
Binns 说,虽然它确实很有用,但“在其他情况下,它更像是一家公司所做的事情,以表明它正在创新。”他怀疑机器取消学习可能会证明是相似的,与其说是数据保护的重大转变,不如说是对技术敏锐度的展示。即使机器学会忘记,用户也必须记住要小心与谁共享数据。
参考链接:
https://www.wired.com/story/machines-can-learn-can-they-unlearn/
本文由AI科技大本营翻译,转载请注明出处。
相关文章:

python tar.gz格式压缩、解压
压缩 代码 import tarfile import os def tar(fname):t tarfile.open(fname ".tar.gz", "w:gz")for root, dir, files in os.walk(fname):print root, dir, filesfor file in files:fullpath os.path.join(root, file)t.add(fullpath)t.close()if __nam…

bzoj1251: 序列终结者 (splay)
splay可以用于维护序列,比如noi的维修序列,比如这道 发现当时splay没写总结,也没题解 然后重新写splay竟然耗了一个晚上 结果是因为max【0】没有附最小值!!血一样的教训 最后祭出inline大法才过,我的splay真…

模型神器组合,yyds!
作者 | 东哥起飞来源 | Python数据科学最近在kaggle上有一个调参神器非常热门,在top方案中频频出现,它就是OPTUNA。知道很多小伙伴苦恼于漫长的调参时间里,这次结合一些自己的经验,给大家带来一个LGBM模型OPTUNA调参的使用教程&am…

理解http响应头中的Date和Age
Date:Date头域表示消息发送的时间,时间的描述格式由rfc822定义。例如,Date: Mon, 04 Jul 2011 05:53:36 GMT。 Age:当代理服务器用自己缓存的实体去响应请求时,用该头部表明该实体从产生到现在经过多长时间了。 比如访…

linux 保留内核中sas驱动的加载导致crash问题
[rootlocalhost ~]# uname -a Linux localhost.localdomain 3.10.0-693.5.2.el7.x86_64 问题描述,在crash的时候,小内核因为分配中断号失败而触发panic,打印如下:(备注:本文大内核就是指正常运行的内核&am…

四层和七层负载均衡的区别
负载均衡设备也常被称为"四到七层交换机",那补充:所谓四层就是基于IP端口的负载均衡;七层就是基于URL等应用层信息的负载均衡;同理,还有基于MAC地址的二层负载均衡和基于IP地址的三层负载均衡。换句换说&…

关于数据库,你可能最想知道的几件事
【CSDN 编者按】随着技术不断更新,数据库的发展可谓全面开花,也吸引了越来越多人的关注,但大家真的都足够了解数据库吗?作者 | 易璜珵 责编 | 侯淼淼出品 | 《新程序员》互联网飞速发展的时代里,数据库、中间件和…

Visual C++ 2012/2013的内存溢出检測工具
在过去,每次编写C/C程序的时候,VLD差点儿是我的标配。有了它,就能够放心地敲代码,随时发现内存溢出。 VLD最高可支持到Visual Studio 2012。不知道以后会不会支持Visual Studio 2013,但反正眼下是不支持的。 相关的讨论…

.NetCore Docker
转载于:https://blog.51cto.com/linhongquan/2047736

集生态之力跨城市数字化之难题,英特尔交上了一份完美答卷
随着数字孪生、人工智能、大数据、云计算、区块链等新兴技术的发展成熟,社会正加大步伐向数字化时代迈进。城市,作为社会民生与经济发展的重要载体,自然站在了数字化建设历程的第一线。当然,数字化城市建设并不是搭建“空中楼阁”…

设置Squid Cache_mem大小
squid代理服务器一般的Unix,Linux都自带。我使用的是CentOS 5.3,Squid是自已编译的。 Squid 默认 cache_mem 100 16 256 打开/etc/squid/squid.conf 配置 $vi /etc/squid/squid.conf #http_port ,是代理的端口,如果没有其他的http服务占用80端口或8080…

centos iptables关于ping
配置iptables策略后,一般来说INPUT都是DROP然后配置需要通过的 当执行: iptables -P INPUT DROP 后,机器就不能被ping通了! 因为icmp没有添加到规则中! 于是我执行如下代码: iptables -A INPUT -p icmp -j …

禁止蒙层底部页面跟随滚动
场景概述 弹窗是一种常见的交互方式,而蒙层是弹窗必不可少的元素,用于隔断页面与弹窗区块,暂时阻断页面的交互。但是,在蒙层元素中滑动的时候,滑到内容的尽头时,再继续滑动,蒙层底部的页面会开始…

squid日志文件太大,怎样处理?
Squid 默认的5天会压缩一次, 在 /etc/logrotate.d/squid中有设置。如果你修改了日志的位置, 请修改 /etc/logrotate.d/squid /home/log/squid/access.log { weekly rotate 5 copytruncate compress notifempty missingok } /home…

安卓系列七(广播机制)
2019独角兽企业重金招聘Python工程师标准>>> 一、什么是广播接收者 广播接收者(BroadcastReceiver)用于接收广播Intent,广播Intent的发送是通过调用Context.sendBroadcast()、Context.sendOrderedBroadcast()来实现的。通常一个广…

第九代小冰惊喜登场,多端融合且琴棋书画样样精通
谈及智能助手,相信大家都不会漏过小冰这款具有划时代意义的产品。从最初的微软小冰到现在的第九代小冰,AI的技术在不断的演进,而小冰也从最初的贴心助手变成了如今琴棋书画样样精通的人工智能前沿技术载体。 北京时间2021年9月22日ÿ…

C++对象赋值的四种方式
1. 引用作为参数的方式传递. 1 GetObject(Object& obj) 2 { 3 obj.value value1; 4 } 特点: 在外部构造一个对象. 把该对象以引用的方式传递到函数中. 从而实现对该对象的改变, 该参数实质是一个[out]类型的参数, 而非[in]类型的参数. 这里的引用可以称为别名. 点评: …

金九银十,不要跳槽!
前言:又到了求职的金九银十的黄金月份,我相信有不少小伙伴已经摩拳擦掌的准备寻找下一份工作。就目前国内的面试模式来讲,在面试前积极的准备面试,复习整个 Java 知识体系将变得非常重要,可以很负责任地说一句,复习准备…

FreeMarker标签介绍
FreeMarker标签使用 一、FreeMarker模板文件主要有4个部分组成 1、文本,直接输出的部分 2、注释,即<#--...-->格式不会输出 3、插值(Interpolation):即${..}或者#{..}格式的部分,将使用数据模型中的部分替代输…

让Squid 显示本地时间
Squid的Error messages 默认的时间显示的GMT时间,而非本地时间,这个有时候看着很别扭。 下面是修改方法,找到Squid的源文件src/errorpage.c 大概在60多行, { ERR_SQUID_SIGNATURE, "\n<BR clear\"all\">\n&…

linux mysql 命令 大全
linux mysql 命令 大全 1.linux下启动mysql的命令: mysqladmin start /ect/init.d/mysql start (前面为mysql的安装路径) 2.linux下重启mysql的命令: mysqladmin restart /ect/init.d/mysql restart (前面为mysql的安装路径) 3.linux下关闭mysql的…

助力5G行业应用扬帆启航,第二届5G毫米波产业高峰论坛圆满召开
当前,5G发展如火如荼,成为引领我国高质量发展的新引擎。5G要想进一步实现向千行百业拓展,离不开全频段的支持,推动5G毫米波发展成为各国共识。为进一步推进5G毫米波产业发展,释放5G全部潜能,助力5G行业应用…

Bootstrap3.x - 源代码分析
参照http://v3.bootcss.com/css/ 文档与源代码colors 比较全面定义总结有意义的颜色。所有uI要用的颜色,都先从已定义的读,这样保证样式的同一性,而且方便以后开发主题库。(建议想自己写css模块的,可以参考一下bootstrap里颜色定义…

清除Squid缓存的小工具
[ 2007-11-2 17:49 | by 张宴 ] 以前我写过一篇《清除指定squid缓存文件的脚本》,但在取URL时存在10%的错误率。如今找到一款老外的程序,可以批量清除某类URL的Squid缓存,支持正则表达式。下载网址:http://www.wa.apana.org.au/~d…

谷歌 AI 编舞师,连张艺兴最喜欢的 Krump 都不在话下
编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 舞蹈一直是文化、仪式和庆祝活动的重要组成部分,也是一种自我表达的方式。今天,存在多种形式的舞蹈,从舞厅到迪斯科。然而,舞蹈是一种需要练习的艺术形…

Python 字典(Dictionary)
Python 字典(Dictionary)字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值(key>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 ,格式如下所示:d {key1 : value1, key2 : value2 …

Varnish Cache 3.0.0安装
https://www.varnish-cache.org/installation/redhat Installation on RedHat 先按需要的模块 在安装软件包之前首先看看主机上的 automake autoconf libtool ncurses-devel libxslt groff pcre-devel pkgconfig软件包是否已经安装 如果没有那么就要首先安装ÿ…

three.js绘制过程(二)
2019独角兽企业重金招聘Python工程师标准>>> 同一个场景中可以有多个摄像机,同一个屏幕缓冲区可以分块绘制不同的物体。 WeblGLRender 中autoClear 设定为false之后, 每次绘制不会清空缓冲区; setSize 设定canvas的大小 setViewpo…

AI 不可以作为专利认证发明人,“因为它不是人”
编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 英格兰和威尔士上诉法院本周驳回了一名男子的请求,该男子要求法院承认他的人工智能系统为两项专利的发明者。 总部位于美国的 Imagination Engines 的创始人 Stephen Thaler 想要给智能机器…

使用工作集(Working Set)整理项目
Eclipse鼓励将不同的功能模块划分为独立的项目存在,这样不但结构清晰,组织起来还非常灵活,因为我们可以用feature对这些项目进行不同的组合,输出后得到具有不同功能的产品。 不过这样一来Package Explorer里的项目会以更快的速度增…