专访英特尔AIPG全球研究负责人Casimir Wierzynski:物理学、隐私和大脑将根本性塑造AI...
记者|琥珀
出品| AI 科技大本营
在 11 月 14 日至 15 日在北京召开的英特尔人工智能大会(AIDC)上,英特尔人工智能产品事业部(AIPG)全球研究负责人 Casimir Wierzynski 发表了主题为《人工智能研究——物理学、隐私和大脑》的演讲。他表示,物理学、隐私和大脑,将根本性地塑造人工智能的未来。
“AI 的一个重大挑战是确保我们释放能力的同时,不违反我们的价值观。其中一个重要的价值观就是隐私。”Casimir Wierzynski 反复强调隐私在 AI 发展中的重要性。他认为,机器学习和隐私之间存在矛盾,机器学习总想要读更多的数据,而隐私天然地想要去隐藏数据。Casimir Wierzynski 的团队正致力于使同态加密及其他私有的机器学习技术变得更加强大和实用。
目前,Casimir Wierzynski 专门负责识别英特尔下一代 AI 系统当中的重要技术,并着力孵化它们。与英特尔 lab 或以产品为导向的团队不同的是,他关注的更多是与 AI 有关的前沿的或者前瞻性的、高端的研究领域。除了进行研究、出版文章外,通常情况下他还会与学术界的科学家进行合作,和英特尔的多个业务组进行合作来测试一些大的想法。
演讲结束后,Casimir Wierzynski 接受了AI科技大本营的专访。以下是演讲的主要内容:
我想跟大家分享三个广泛的话题,现在英特尔正在去努力,并且我们相信这三个方面将会根本性的改变整个人工智能方面的领域,也就是物理学、隐私和大脑。
在英特尔,我们非常在意材料物理学,并进行了材料物理学方面的很多研究。例如在室温下可以做磁铁的有三种元素,铁、钴、镍。今年我的同事做出了一个根本性的发现,就是还有第四个元素,就是钌。这是在《自然通讯》杂志上今年早些时候发表的。但是物理学和 AI 之间有什么样的关系,AI 的物理学是什么意思呢?
这个答案对于 AI 的计算力有一个指数型的需求,这张图来自 OpenAI 的报告,他们测量了达到这个关键的 AI 研究里程碑所需要的浮点运算的数量,这是对数尺度的,所以直线表明了是指数型的。
他们发现对于 AI 计算的需求可以说是在过去六年当中每 3.5 个月会发生翻倍,在六年当中达到了大概 30万倍。所以 AI 计算在这样的速度上来扩展,对于整个的算法、架构以及所有的硬件、基片来讲,对产业来讲就是一个巨大的挑战。这就是物理学能够帮忙的地方。
关键并不是要把物理学当作一个限制,而是一种工具。Richard Feynman 在 1959 年就指出了,而且今天也是正确的,就是在纳米级别的创新方面还有大量的空间。在我的团队当中,我们研究的一个技术就是怎么样去利用制造芯片的第三维度,这是一个很有希望的想法,在晶体管上一层一层去叠加更多的层数,导致垂直连接的高密度,叫“整体的 3D 集成电路”。
通过这些设备以 3D 的方式来进行密集的连接,你可以去减少这种信号传输所需要经过的线缆的长度,会减少计算的耗能,并且帮助你扩大在一个单位面积内的晶体管数量,这个设备是在去年斯坦福大学所完成的,并在《自然》杂志上刊登。
我的团队正在和主要作者 Subhashish Mitra 教授共同探讨,看如何把它用在 AI 工作负载上。如果未来进一步展望,我们调查新的设备基于新的材料和新的物理学的新设备。大部分今天的计算都是基于这种布林逻辑,涉及到开和关,我们使用的晶体管是基于大家熟悉的理念。但是还有一些物质的其他物理特性是可以利用的,比如说控制开关传输信号和去读出这些信号。
另外一个非常重要的 AI 问题,就是隐私问题。AI 的一个挑战是确保我们要释放能力的同时,不违反我们的价值观。在机器学习和隐私之间存在一些矛盾,机器学习总想要读更多的数据,而隐私天然的想要去隐藏数据,我的团队正在研究一些方式,使用密码学来解决这种矛盾,然后使得我们可以有更多的 AI 新的用例。假设一个用户有一个非常私密的数据,他希望能够在云上对这个数据进行处理,如果他能够去将这些数据来进行加密,并且把他们去发到云上进行处理,而不需要分享这个密钥的话,而且可以得到一个加密的回传,会是非常理想的。这种能力来进行加密数据的计算,叫做所谓的“同态加密”。
2009 年,由于加密技术取得了突破性进展,同态加密在理论上已变得可行,但是它在实践中几乎不可行,因为它需要进行太多的计算。
自那之后,同态方案得到了巨大改进,尤其是在执行深度学习中使用的各种计算方面,如矩阵乘法。
我的团队正在致力于使同态加密及其他私有的机器学习技术变得更加强大和实用。尽管这是开发者大会,但我要提及的一点是,我们也在努力使非专业人员能够轻松使用这些加密工具。你可以将同态加密视为一种用于运行模型的不同硬件目标。它是一台接受加密输入并输出加密答案的机器。
因此,我们针对英特尔 nGraph 编译器创建了后端,使开发人员能够使用 TensorFlow 或 PyTorch 等框架构建模型,然后对这些模型进行编译,让它们可以在使用加密输入的情况下运行。我们的目标是在今年年底之前,将这款工具作为开源工具提供。
到目前为止,我们已经谈到了如何能够去把 AI 人工智能结合起来,把计算进行加密,我们这个业务组在不断地推动 AI 的前沿,通过了解人的大脑是如何发挥贡献的,因为我们作为神经生物科学家,所兴奋得不光是能够更好的开发人工智能的系统,还有解密全人类有史以来最大的神秘,也就是大脑机理。
我们知道,大脑是终极的人工智能机器,深度神经网络就是由大脑所启发,实际上就是大脑的不同的并行的一些电路板,正如神经网络的模型生物的这些神经元,也是这样排列,它们是线性的输入、非线性的输出。
深度学习在过去十多年取得了巨大的成功,这也是为什么今天我们能够在这里探讨这个话题,但仍然深度学习还有一些麻烦的地方,比如现在的模型很难从几个小时的数据就能进行推测。对于目前深度学习的系统来说是很难实现的,可能需要几百个样本,而人类可以非常高效地进行推测、或特征寻找。
非常高兴得能够与大家分享我的工作成果。谢谢聆听。
以下为AI科技大本营专访实录,并做了不改变愿意的整理:
AI科技大本营:首先请您简单介绍一下在加入英特尔一年多做了哪些工作,包括技术方面以及人员方面的成果和进展。
Casimir Wierzynski:我负责英特尔人工智能产品部门的研发团队建设工作,目标是确保我所组建的研究团队的人员,每个人能将百分之百的时间投入到与人工智能研究的工作上来。英特尔公司一直以来开展大量与人工智能有关的研究工作。但我认为非常有必要专门找到这样一群人,打造一个无论是从时间的分配上和职责的分配上都是百分之百投入到 AI 相关研究的团队。
AI科技大本营:刚才您在台上也提到了用密码学去解决机器学习与隐私之间挑战的问题,这个解决方案是如何想到的?此外,提到今年年底会开放同态加密的工具,提供给开发人员,但是它有一个问题,比如消耗大量的计算时间,能否具体讲讲英特尔在这方面是如何解决的?
Casimir Wierzynski:首先我要澄清一下,实际上同态加密这个想法也不算是我想到的,最早是 2009 年 Craig Gentry 在斯坦福攻读博士的论文 (A Fully Homomorphic Encryption Scheme, Gentry, 2009) 里所写到。我之前经常拜访麻省理工,拜访教授,就他们最新的成果进行演讲,其中有一位教授提到了同态加密。我们确实知道同态加密这个方法的计算强度确实非常大,但当时那位教授向我们介绍了他的论文,基于他的论文我们发现计算的强度已经实现了大规模的下降。我当时就有这种感觉,我觉得这个技术现在已经非常接近可以用在商业化的规模上。
当然,具体你说的某一项特定技术会在哪个时间点上腾飞、起飞,这个现在很难说,但至少我有这样一种感觉,同态加密已经发展到即将可能进行商业化大规模使用的时间点上。
您的第二个问题主要是问到英特尔在特定的领域里会做哪些工作,让它采纳起来的难度会有所降低。我觉得主要是分成三个部分:
第一,英特尔内部有很多专门从事密码学的研究人员,他们会开发出非常好的算法来支持技术;
第二,我们也有非常大量的、优秀的软件工程技术方面的人才,他们可以使得整个库变得更可获得、更好用,这也是今天我在大会演讲当中主要提到的;
第三,实际上也是英特尔一贯的做法,如果英特尔认为这是一个非常重要的工作,或者具有关键性意义的工作,我们会进行相应的投入,会有一个比较明确的路线图来指导这个工作。
最后我还是想再补充一下,之前在大会上主要谈的是同态加密的做法,它的主要目的是用来协调在机器学习和隐私方面的关系。但是我想说的是,同态加密只是在解决技术挑战方面的工具之一,换而言之,现在还有其他的工具,我们也在考虑、在看,因此同态加密并不是唯一的银子弹。
AI科技大本营:看到您更加关注的是机器学习方面的技术发展,最近谷歌 DeepMind 的 BigGAN 在图像生成方面取得了非常大的进展,您这项成果发展是如何看待的?与谷歌是如何展开合作的?
Casimir Wierzynski:首先要说明的是,谷歌和英特尔的工程技术人员在很多的话题和领域当中都开展了很多合作。在深度学习网络出现之后,企业需要来评估这事是否是将来会做大,并且可能是一个很大的突破。
关于您提到的问题,刘茵茵(AIPG数据科学部主任)所带领的团队是做深度学习的相关研究,和我的团队相比,她的团队是更着重在深度学习上。而且我跟刘茵茵的办公室很近,我俩时不时就具体的算法问题来沟通和交流。AI 产品集团部门在技术上内部的沟通和交流是挺频繁的,不过具体说到算法和深度学习还是刘茵茵的团队管得多一些。
AI科技大本营:您对于在 NIPS 这样机器学习顶会上发表论文是如何看待的?是否把它看作一个主要的工作成果或是KPI的展示?
Casimir Wierzynski:我们确实是非常鼓励英特尔的研究人员积极参与顶级学术会议,并发表论文。如果是和神经学方面研究有关的,那就可以是 NIPS。我们的研究发表论文也不局限于特定的领域,任何的话题都可能。如果是涉及到半导体或者芯片,我们可能会选择像《自然》或者是《科学》这样的期刊去发表。密码学那边也有专门的学术会议,也有专门的期刊。我们还是非常鼓励员工能够积极的参与这些学术期刊文章的发表和学术会议,这样可以来展示他们的研究成果。
AI科技大本营:云端芯片和终端芯片在各自的应用场景都非常有用,包括云端更多的是用于深度学习训练和推测,终端芯片更多的应用在医疗、视频监控等物联网场景。英特尔目前倾向于哪个方向,基于怎样的战略和技术方面的考量?
Casimir Wierzynski:我尝试着用一种风趣的方法来回答你的问题。我前面也讲过,我们做的研究工作主要是放眼长远,所以我们的地平线是在很远的地方,如此之远,以至于可以同时涵盖云端的研究和边缘或者终端的研究,就好像我很幸运,不需要在我的两个孩子当中挑出我更爱谁多一点。
BDTC 2018
◆
精彩纷呈
◆
2018 年12月6-8 日,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN、中科天玑数据科技股份有限公司协办的 2018 中国大数据技术大会(BDTC 2018),将在北京新云南皇冠假日酒店隆重举行。
除 Keynote 外,主办方精心策划了 13 场专题技术和行业论坛,涵盖大数据分析与生态系统、深度学习、推荐系统、大数据安全与政策、大数据可视分析、精准医疗大数据、数据科学与大数据技术教育、数据库、金融大数据、知识图谱、工业大数据、区块链、交通与旅游大数据等主题。
届时,近百位技术专家及行业领袖将齐聚于此,聚焦大数据技术如何促进数字经济迅速发展,关注大数据新应用,思辨通达,深入解析热门技术在行业中的实践和落地。紧贴时代脉搏,走近数据前沿。
推荐阅读
ImageNet时代将终结?何恺明新作:Rethinking ImageNet Pre-training
“万”字谏言,给那些想学Python的人,建议收藏后细看!
2W台服务器、每秒数亿请求,微信如何不“失控”?
Istio,下一个Kubernetes?
炸了!刚写完这段代码,就被开除了…
中国可以没有俞敏洪, 区块链不能没有这些女王们, 女性从业者现状调查
相关文章:

flash php socket通信_php与flash as3 socket通信传送文件实现代码
前段时间在flashseer看到有人提到:可以通过socket方式传送swf文件,让用户无法获取到swf文件… 当时还没有出as3的反编译,所以对程序的保护没有在意.随着反编译程序的平民化,不希望别人看到源代码的朋友就比较着急…通过socket方式传送swf文件来避免泄漏源代码的思路(只适用as3)…

全线衰退:PC产业一枝孤秀
之三:全线衰退:PC产业一枝孤秀 在3C中,也许个人电脑(PC)产业算是当今中国最有希望的。中国的计算机工业号称已有50年历程,但成为民用产品的起始点应在30年前,与改革开放同时起步。1978年,国家成立了计算机工…

用Gogs在Windows上搭建Git服务
1.下载并安装Git,如有需求,请重启服务器让Path中的环境变量生效。2.下载并安装Gogs,请注意,在Windows中部署时,请下载MiniWinService(mws)版本。3.在MariaDB中创建一个命名为Gogs的数据库&#…

wamp安装多版本php,WampServer安装多个php版本
早期的WampServer安装多个版本php很简单,只需要单击php下的Get more...就行了,WampServer会自动导航到http://www.wampserver.com/addons_php.php下去安装php,但目前这种方式好像不行了,该页面找不到了,那么我们只能手…

利用Windows自带服务架设免费邮件服务器
在Windows Server 2003中带有完整的SMTP和POP3服务,并且能够支持有域和无域两种环境,非常便于中小型企业实施。今天,小编就以Windows Server 2003企业版为例带领大家架设一台免费的邮件服务器,希望能够对各位朋友学习邮件服务器提…

阿里首次开源深度学习框架X-Deep Learning
今年,各企业在开源路上的势头可以说是“你追我赶”,谁也不甘落后。6 月,小米宣布开源自己在移动端深度学习框架 MACE;9 月,腾讯 AI Lab 宣布开源一款自动化深度学习模型压缩与加速的框架——PocketFlow。双十一刚过&am…

应用基于资产的开发到 SOA 的服务中1
SOA 的主要原则之一是在整个 SOA 生命周期中将服务视为可重用资产。因此,务必在 SOA 中对服务应用正式的资产开发流程和指南。本文可帮助 IT 架构师、项目经理和 SOA 管理员全面了解一些主要 IBM 产品如何协作来帮助有效地在 SOA 中将服务作为可重用资产进行创建、使…

用Piranha来实现WEB的负载均衡
简述:利用(LVSPiranha)基于完整开源软件的架构可以提供一个简单的负载均衡及高可用的服务架构。LVS 集群采用 IP 负载均衡技术和基于内容请求分发技术。调度器具有很好的吞吐率(在DR模式下),将请求均衡地转移到不同的服务器上执行,且调度器自动屏蔽掉服务器的故 障,…

SQLServer数据库试题及答案
选择题:(20分) 1、根据关系数据基于的数据模型——关系模型的特征判断下列正确的一项:(___) A、只存在一对多的实体关系,以图形方式来表示。 B、以二维表格结构来保存数据,在…

php中怎样阻止网页进行跳转,阻止php页面跳转方法
阻止php页面跳转方法一、 header 函数header()函数的主要功能是将HTTP协议标头(header)输出到浏览器。参数void header (string string [,bool replace [,int http_response_code]])可选参数replace指明是替换前一条类似标头还是添加一条相同类型的标头,默认为替换。…

张宏江:人工智能的长远发展需要有人坐冷板凳
从金山 CEO 退休两年后,除了在源码资本任职投资合伙人,张宏江又在刚刚成立不久的北京智源人工智能研究院担任首届理事长,致力于推动不同行业分享大数据,让从事基础研究院所和 AI 的创业公司更容易获得数据。作为一个横跨产学研、投…

Python 中的进程、线程、协程、同步、异步、回调(一)
在进一步之前,让我们先回顾一下各种上下文切换技术。 不过首先说明一点术语。当我们说“上下文”的时候,指的是程序在执行中的一个状态。通常我们会用调用栈来表示这个状态——栈记载了每个调用层级执行到哪里,还有执行时的环境情况等所有有关…

php iis6 安装ssl证书,在IIS下部署SSL证书实现HTTPS
HTTPS是以安全为目标的HTTP通道,简单讲是HTTP的安全版。谷歌已经制定了一项长远的计划,它的最终目标是将所有通过HTTP协议呈现的网页标为“不安全”,对于站长来说,部署SSL证书来迁移到HTTPS是一个现实和重要的问题,那么…

今晚8点直播 | 微软亚洲研究院副院长刘铁岩:机器学习技术前沿与未来展望
人工智能正受到越来越多的关注,而这波人工智能浪潮背后的最大推手就是“机器学习”。机器学习从业者在当下需要掌握哪些前沿技术?展望未来,又会有哪些技术趋势值得期待? AI科技大本营联合华章科技特别邀请到了微软亚洲研究院副院…

11月最佳机器学习开源项目Top10!
整理 | Jane出品 | AI科技大本营过去一个月,我们从近 250 个机器学习开源项目中挑选出了最受大家关注的前十名。这些项目在 GitHub 上平均 Stars 数为 2713。这些项目涉及由 Google AI Research 开源的 BERT 预训练模型、DeepMind 开源的图网络库、Facebook Researc…

notepad php发布网站,谈谈如何把WordPress部署到服务器上
第一次部署本网站,稀里糊涂差不多用了大半天,真是惭愧呀,很想狠狠的抽自己一下。老子信了你的邪!!!废话不多说,大概的步骤是:前奏1.注册域名--云主机购买--域名备案--域名解析(dodo也是首次对这…

单列索引和复合索引的使用
表结构: mysql> desc car; ----------------------------------------------------------- | Field | Type | Null | Key | Default | Extra | ----------------------------------------------------------- | id | int(3) | NO …

java学习1
工作了很久,以前学的技术都差不多忘了,为了不荒废技术,现在开始起学习java,并将学习中遇到的问题加以记录。问题1、Exception in thread "main" java.lang.NoClassDefFoundError解决方法:这类问题导致的可能…

ICLR 2019高分论文抢先看,谁是第一?
作者 | 非主流出品 | AI科技大本营 ICLR 2019 将于明年的 5 月 6-9 日在美国路易斯安那州的新奥尔良市举行。本届大会共收到近 1600 篇投稿,相比 ICLR 2018 的 935 篇,以及 ICLR 2017 的 490 篇,几乎每年都在翻番。此前,ICLR 一直…

招行java开发面试,面经:Java后台开发-招行网络科技
一面:留学党的惯性凌晨面试1内容:自我介绍Final关键字数据库(mysql/oracle二选一)数据库调优脏幻不可重复读(mybatis/radis二选一)基本操作(批量插入/如何保证一致性)几种创建新对象方法我成功引导向了反射的诸多应用TCP/UDP老生常谈的区别和三挥四握问题…

puppet相关问题统计
1、 notice: Run of Puppet configuration client already in progress; skipping 解决方法: 部分情况下puppet服务会无法启动,且会提示puppet已经启动,这个时候需要删除一个文件。 rm /var/lib/puppet/state/puppetdlock …

WebForm中DataGrid的20篇经典文章
1、DataGrid动态模板列更新数据并且分页的例子 http://www.cnblogs.com/lovecherry/archive/2005/03/26/126102.html 2、DataGrid动态添加模板列的一个例子 http://www.cnblogs.com/lovecherry/archive/2005/03/25/125526.html 3、DataGrid实现增删(带提示ÿ…

Kotlin基本语法和使用
Kotlin 是一个基于 JVM 的新的编程语言,由 JetBrains 开发。与Java相比,Kotlin的语法更简洁、更具表达性,而且提供了更多的特性。 Kotlin是使用Java开发者的思维被创建的,Intellij作为它主要的开发IDE。对于 Android开发者&#…

java注解返回不同消息,Spring MVC Controller中的一个读入和返回都是JSON的方法如何获取javax.validation注解的异常信息...
Spring MVC Controller中的一个读入和返回都是JSON的方法怎么获取javax.validation注解的错误信息?本帖最后由 LonelyCoder2012 于 2014-03-14 03:16:27 编辑标题可能有点绕,看代码就明白了:这是我的User类:import org.hibernate.…

三摄正普及,四摄在路上?谷歌逆天AI算法,只做单摄虚化
作者| 琥珀出品| AI科技大本营想要提高拍照效果,想必对于多数手机厂商而言,给手机塞进更多的摄像头似乎成了当前主流做法,例如“普通摄像头景深摄像头”、“黑白彩色摄像头”、“广角长焦摄像头”……不过,偏偏有这么一家企业反其…

TBContact -- 导出ThunderBird邮件地址本
我写的一个导出ThunderBird邮件地址本的小工具,使用了多线程。其功能有:1 自动检测系统是否装有ThunderBird,并列出所有的地址本文件*.mab。2 可以手工指定一个或多个地址本文件。3 自动检测每个地址本文件里的联系人个数。4 导出每个地址本文…

Linux基础知识入门测试
记录于51CTO的测试题: 第 1 题 Linux中,默认的管理员帐户名称是 A. Administrator B. Admin C. root D. user 第 2 题 在Linux中,如果在文本模式下,可以通过下述的方法进入x window A. 执行startx B. 执行start …

jsp mysql 图片路径,请教JSP中怎么向MySql中存入和取出图片
当前位置:我的异常网 Java Web开发 请教JSP中怎么向MySql中存入和取出图片请教JSP中怎么向MySql中存入和取出图片www.myexceptions.net 网友分享于:2015-08-27 浏览:138次请问JSP中如何向MySql中存入和取出图片?1 直接把图片存入数据库2 把图片的…

开源 | IBM、哈佛共同研发:Seq2Seq模型可视化工具
作者 | Ben Dickson译者 | 刘旭坤编辑 | Jane出品 | AI科技大本营近年来随着深度学习和神经网络技术的发展,机器翻译也取得了长足的进步。神经网络结构越来越复杂,但我们始终无法解释内部发生了什么,“黑箱问题”一直困扰着我们。我们不清楚程…

h3c l2tp ***配置
远程用户-------internet-------F100 采用l2tp方式sysname XXXX //设备名称#l2tp enable //开启l2tp功能 #firewall packet-filter enablefirewall packet-filter default permit#undo connection-limit enableconnection-limit default den…