专访英特尔AIPG全球研究负责人Casimir Wierzynski:物理学、隐私和大脑将根本性塑造AI
出品| AI 科技大本营
在 11 月 14 日至 15 日在北京召开的英特尔人工智能大会(AIDC)上,英特尔人工智能产品事业部(AIPG)全球研究负责人 Casimir Wierzynski 发表了主题为《人工智能研究——物理学、隐私和大脑》的演讲。他表示,物理学、隐私和大脑,将根本性地塑造人工智能的未来。
有数据表明,AI 对于计算的需求每 3.5 个月便会翻倍,在过去六年当中增长了约 300000 倍。由此,人工智能对于算法、架构以及所有的硬件乃至整个产业来讲都是一个巨大的挑战,这是物理学能够帮助 AI 的地方,只有物理学突破才能满足 AI 计算的爆发式增长需求。
“AI 的一个重大挑战是确保我们释放能力的同时,不违反我们的价值观。其中一个重要的价值观就是隐私。”Casimir Wierzynski 反复强调隐私在 AI 发展中的重要性。他认为,机器学习和隐私之间存在矛盾,机器学习总想要读更多的数据,而隐私天然地想要去隐藏数据。Casimir Wierzynski 的团队正致力于使同态加密及其他私有的机器学习技术变得更加强大和实用。
Casimir Wierzynski 认为,大脑是终极的人工智能机器,深度神经网络就是由大脑所启发。不断推动 AI 的前沿发展,需要了解人的大脑是如何运转的。英特尔所兴奋的不仅是能够更好地开发人工智能系统,而是解密全人类最大的神秘——大脑的机理。
目前,Casimir Wierzynski 专门负责识别英特尔下一代 AI 系统当中的重要技术,并着力孵化它们。与英特尔 lab 或以产品为导向的团队不同的是,他关注的更多是与 AI 有关的前沿的或者前瞻性的、高端的研究领域。除了进行研究、出版文章外,通常情况下他还会与学术界的科学家进行合作,和英特尔的多个业务组进行合作来测试一些大的想法。
演讲结束后,Casimir Wierzynski 接受了AI科技大本营的专访。
以下是演讲的主要内容:
我想跟大家分享三个广泛的话题,现在英特尔正在去努力,并且我们相信这三个方面将会根本性的改变整个人工智能方面的领域,也就是物理学、隐私和大脑。
在英特尔,我们非常在意材料物理学,我们进行材料物理学方面的很多研究。比如现在给大家一个小测试:在室温下可以做磁铁的有三种元素,铁、钴、镍。今年我的同事做出了一个非常根本性发现,就是还有第四个元素,就是钌。这是在《自然通讯》杂志上今年早些时候发表的。但是物理学和 AI 之间有什么样的关系,AI 的物理学是什么意思呢?
这个答案对于 AI 的计算力是有一个指数型的需求,这张图来自 OpenAI 的报告,他们测量了达到这个关键的 AI 研究里程碑所需要的浮点运算的数量,这是对数尺度的,所以直线表明了是指数型的。他们发现对于 AI 计算的需求可以说是在过去六年当中每 3.5 个月会发生翻倍,在六年当中达到了大概 30万倍。所以 AI 计算在这样的速度上来扩展,对于整个的算法、架构以及所有的硬件、基片来讲,对产业来讲就是一个巨大的挑战。这就是物理学能够帮忙的地方。
关键并不是要把物理学当作一个限制,而是一种工具。Richard Feynman 在 1959 年就指出了,而且今天也是正确的,就是在纳米级别的创新方面还有大量的空间。在我的团队当中,我们研究的一个技术就是怎么样去利用制造芯片的第三维度,这是一个很有希望的思想,在晶体管上一层一层去叠加更多的层数,导致垂直连接的高密度,这叫做“整体的 3D 集成电路”。通过这些设备以 3D 的方式来进行密集的连接,你可以去减少这种信号传输所需要经过的线缆的长度,会减少计算的耗能,并且帮助你扩大在一个单位面积内的晶体管数量,这个设备是在去年斯坦福大学所完成的,并在《自然》杂志上刊登。
我的团队正在和他的主要作者 Subhashish Mitra 教授共同探讨,看如何把它用在 AI 工作负载上。如果未来进一步展望,我们调查新的设备基于新的材料和新的物理学的新设备。大部分今天的计算都是基于这种布林逻辑,涉及到开和关,我们使用的晶体管是基于大家熟悉的理念,使用电厂来开或者关掉电流。但是还有一些物质的其他物理特性是可以利用的,比如说控制开关传输信号和去读出这些信号。
另外一个非常重要的 AI 问题,就是隐私问题。AI 的一个挑战是确保我们要释放能力的同时,不违反我们的价值观。在机器学习和隐私之间存在一些矛盾,机器学习总想要读更多的数据,而隐私天然的想要去隐藏数据,我的团队正在研究一些方式,使用密码学来解决这种矛盾,然后使得我们可以有更多的 AI 新的用例。假设一个用户有一个非常私密的数据,他希望能够在云上对这个数据进行处理,如果他能够去将这些数据来进行加密,并且把他们去发到云上进行处理,而不需要分享这个密钥的话,而且可以得到一个加密的回传,会是非常理想的。这种能力来进行加密数据的计算,叫做所谓的“同态加密”。
2009 年,由于加密技术取得了突破性进展,同态加密在理论上已变得可行,但是它在实践中几乎不可行,因为它需要进行太多的计算。
自那之后,同态方案得到了巨大改进,尤其是在执行深度学习中使用的各种计算方面,如矩阵乘法。
我的团队正在致力于使同态加密及其他私有的机器学习技术变得更加强大和实用。尽管这是开发者大会,但我要提及的一点是,我们也在努力使非专业人员能够轻松使用这些加密工具。你可以将同态加密视为一种用于运行模型的不同硬件目标。它是一台接受加密输入并输出加密答案的机器。因此,我们针对英特尔 nGraph 编译器创建了后端,使开发人员能够使用 TensorFlow 或 PyTorch 等框架构建模型,然后对这些模型进行编译,让它们可以在使用加密输入的情况下运行。我们的目标是在今年年底之前,将这款工具作为开源工具提供。
到目前为止,我们已经谈到了如何能够去把 AI 人工智能结合起来,把计算进行加密,我们这个业务组在不断地推动 AI 的前沿,通过了解人的大脑是如何发挥贡献的,因为我们作为神经生物科学家,所兴奋得不光是能够更好的开发人工智能的系统,还有解密全人类有史以来最大的神秘,也就是大脑机理。我们知道,大脑是终极的人工智能机器,深度神经网络就是由大脑所启发,实际上就是大脑的不同的并行的一些电路板,正如神经网络的模型生物的这些神经元,也是这样排列,它们是线性的输入、非线性的输出。
我们知道深度学习在过去十多年取得了巨大的成功,这也是为什么今天我们能够在这里探讨这个话题,但仍然深度学习还有一些麻烦的地方,比如现在的模型很难从几个小时的数据就能进行推测。对于目前深度学习的系统来说是很难实现的,可能需要几百个样本,而人类可以非常高效地进行推测、或特征寻找。
我们还需要去找到大脑工作的一些原理。我的团队和哈佛与麻省理工的科学家合作,能够以纳米级的清晰度来去扫描大脑并重建单个神经元突触。Jeff Lichtman 在哈佛大学的实验室有一台机器,可以把大脑做切片,每个切片是 30 纳米的厚度,做完这些切片之后就进行海量计算工作。从清晰度上看,一立方毫米图像的大小是 60GB ,一立方毫米的大脑则占用 2 PB 的数据。所有的数据都必须和其他的数据连起来,组成分层的 3D 的大脑模型。
我们可以非常清晰地跟踪到这样神经元的突触,就是图中红色的球球,如果把它放大的话,神经生物学家就可以对它进行重构,然后测试各种各样的原理,比如“在大脑的细胞之间新的连接是如何产生的?”、“同时找到不同的大脑以及不同的大脑之间的一些信号产生,从而更好的理解大脑是如何工作的?”谈到神经网络,这样的图形能够帮我们更好的理解大脑工作的原理和结构。
非常高兴得能够与大家分享我的工作成果。谢谢聆听。
以下为AI科技大本营专访实录,并做了不改变愿意的整理:
CSDN:首先请您简单介绍一下在加入英特尔一年多做了哪些工作,包括技术方面以及人员方面的成果和进展。
Casimir Wierzynski:我负责英特尔人工智能产品部门的研发团队建设工作,目标是确保我所组建的研究团队的人员,每个人能将百分之百的时间投入到与人工智能研究的工作上来。英特尔公司一直以来开展大量与人工智能有关的研究工作。但我认为非常有必要专门找到这样一群人,打造一个无论是从时间的分配上和职责的分配上都是百分之百投入到 AI 相关研究的团队。
CSDN:刚才您在台上也提到了用密码学去解决机器学习与隐私之间挑战的问题,这个解决方案是如何想到的?此外,提到今年年底会开放同态加密的工具,提供给开发人员,但是它有一个问题,比如消耗大量的计算时间,能否具体讲讲英特尔在这方面是如何解决的?
Casimir Wierzynski:首先我要澄清一下,实际上同态加密这个想法也不算是我想到的,最早是 2009 年 Craig Gentry 在斯坦福攻读博士的论文 (A Fully Homomorphic Encryption Scheme, Gentry, 2009) 里所写到。我之前经常拜访麻省理工,拜访教授,就他们最新的成果进行演讲,其中有一位教授提到了同态加密。我们确实知道同态加密这个方法的计算强度确实非常大,但当时那位教授向我们介绍了他的论文,基于他的论文我们发现计算的强度已经实现了大规模的下降。我当时就有这种感觉,我觉得这个技术现在已经非常接近可以用在商业化的规模上。当然,具体你说的某一项特定技术会在哪个时间点上腾飞、起飞,这个现在很难说,但至少我有这样一种感觉,同态加密已经发展到即将可能进行商业化大规模使用的时间点上。
您的第二个问题主要是问到英特尔在特定的领域里会做哪些工作,让它采纳起来的难度会有所降低。我觉得主要是分成三个部分:
第一,英特尔内部有很多专门从事密码学的研究人员,他们会开发出非常好的算法来支持技术;第二,我们也有非常大量的、优秀的软件工程技术方面的人才,他们可以使得整个库变得更可获得、更好用,这也是今天我在大会演讲当中主要提到的;第三,实际上也是英特尔一贯的做法,如果英特尔认为这是一个非常重要的工作,或者具有关键性意义的工作,我们会进行相应的投入,会有一个比较明确的路线图来指导这个工作。
最后我还是想再补充一下,之前在大会上主要谈的是同态加密的做法,它的主要目的是用来协调在机器学习和隐私方面的关系。但是我想说的是,同态加密只是在解决技术挑战方面的工具之一,换而言之,现在还有其他的工具,我们也在考虑、在看,因此同态加密并不是唯一的银子弹。
CSDN:看到您更加关注的是机器学习方面的技术发展,最近谷歌 DeepMind 的 BigGAN 在图像生成方面取得了非常大的进展,您这项成果发展是如何看待的?与谷歌是如何展开合作的?
Casimir Wierzynski:首先要说明的是,谷歌和英特尔的工程技术人员在很多的话题和领域当中都开展了很多合作。在深度学习网络出现之后,企业需要来评估这事是否是将来会做大,并且可能是一个很大的突破。
关于您提到的问题,刘茵茵(AIPG数据科学部主任)所带领的团队是做深度学习的相关研究,和我的团队相比,她的团队是更着重在深度学习上。而且我跟刘茵茵的办公室很近,我俩时不时就具体的算法问题来沟通和交流。AI 产品集团部门在技术上内部的沟通和交流是挺频繁的,不过具体说到算法和深度学习还是刘茵茵的团队管得多一些。
CSDN:您对于在 NIPS 这样机器学习顶会上发表论文是如何看待的?是否把它看作一个主要的工作成果或是KPI的展示?
Casimir Wierzynski:我们确实是非常鼓励英特尔的研究人员积极参与顶级学术会议,并发表论文。如果是和神经学方面研究有关的,那就可以是 NIPS。我们的研究发表论文也不局限于特定的领域,任何的话题都可能。如果是涉及到半导体或者芯片,我们可能会选择像《自然》或者是《科学》这样的期刊去发表。密码学那边也有专门的学术会议,也有专门的期刊。我们还是非常鼓励员工能够积极的参与这些学术期刊文章的发表和学术会议,这样可以来展示他们的研究成果。
CSDN:云端芯片和终端芯片在各自的应用场景都非常有用,包括云端更多的是用于深度学习训练和推测,终端芯片更多的应用在医疗、视频监控等物联网场景。英特尔目前倾向于哪个方向,基于怎样的战略和技术方面的考量?
Casimir Wierzynski:我尝试着用一种风趣的方法来回答你的问题。我前面也讲过,我们做的研究工作主要是放眼长远,所以我们的地平线是在很远的地方,如此之远,以至于可以同时涵盖云端的研究和边缘或者终端的研究,就好像我很幸运,不需要在我的两个孩子当中挑出我更爱谁多一点。
相关文章:

微软OOXML申请国际文档标准已获通过 中国投反对票
51CTO.com北京时间3月28日中午通过消息灵通人士获悉,微软新一代文档标准OOXML已经获得国际标准化组织(ISO)的通过。中国依然投反对票。 ISO共有104个成员,其中包括41个技术能力强、参与标准化活动多的“P成员”。若微软文档标准想…

java中的匿名类方法覆盖_Java技巧:用匿名类来实现简化程序调试
Java技巧:用匿名类来实现简化程序调试在Java中,匿名类(Anonymous inner classes)多用来处理事件(event handle)。但其实,它们对于debug也很有帮助。本文将介绍如何利用匿名类来简化你的debug。我们该如何调试那些非自己源码的方法调用呢&…

记录第一次在egret项目中使用Puremvc
这几天跟着另一个前端在做一个小游戏,使用的是egret引擎和puremvc框架,这对于我来说还是个比较大的突破吧,特此记录下。 因为在此项目中真是的用到了mvc及面向对象编程,值得学习 记录第一次在egret项目中使用Puremvc: …

使用CSS制作圆角效果
Web2.0中,圆角效果是很常见的,以前都是用图片来模仿,现在直接用css就能实现,例子代码如下 Html代码: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <head> &…

知识图谱升温之势已现,不要错失下一个AI风口
近年来,随着大家对高级认知能力的积极探索,知识图谱因为表达能力强,扩展性好,并能兼顾人类认知与机器自动处理,引起了学术界、工业界以及政府部门的高度关注。 最先被大家熟知的应用领域应属搜索引擎,为了…

干货 | 谷歌BERT模型fine-tune终极实践教程
作者 | 奇点机智从11月初开始,Google Research就陆续开源了BERT的各个版本。Google此次开源的BERT是通过TensorFlow高级API—— tf.estimator进行封装(wrapper)的。因此对于不同数据集的适配,只需要修改代码中的processor部分,就能进行代码的…

java简介 ppt 精_《JAVA》5选择结构精篇课件.ppt
《JAVA》5选择结构精篇课件选 择 结 构 if 语句 if – else语句 Switch语句 块作用域语句又被称为复合语句,其格式为:用一对花括号将若干条语句括起来,目的是从语法上可以将多条语句解释成一条语句。 { int temp; temp a; a b; …

UPDATE STATISTICS 有何妙用?
txlicenhe 马可 一直没有关注它,今天刚学到的一招,还没彻底弄清楚。 情况是这样,有一个视图,用到了好几个表,其中一个表改了一些资料,在前台操作时总是超时过期(前台设置超时时间不长 60s&#…

js with用法
1)简要说明 with 语句可以方便地用来引用某个特定对象中已有的属性,但是不能用来给对象添加属性。要给对象创建新的属性,必须明确地引用该对象。 2)语法格式 with(object instance) { //代码块 } 有…

大数据时代,谁的眼神锁定你?
数据时代当前,欢迎来到楚门的世界。双十一余韵未歇,刚处理完一波售后及退件等“剁手后遗症”的各方人马也已经为再战双十二做好了准备。截至 12 日零点,天猫双十一成交额达 2135 亿元。与此同时,据国家邮政局监测数据显示…

Java类Demo中存在_Java中的数据类型转换
先来看一个题:Java类Demo中存在方法func0、func1、func2、func3和func4,请问该方法中,哪些是不合法的定义?( )public class Demo{float func0(){byte i1;return i;}float func1(){int i1;return;}float func2(){short i2;return i…

Exchange2000需要创建的3个SMTP服务实例
前一阵搞了邮件系统的安全加固,前面说的SA是一个方面,总觉得在SMTP上还有文章可做。分析一下公司的系统环境,SMTP的访问大概分这么三类:1、来自客户端的访问。2、来自公司业务系统服务器的访问。3、来自外部其它邮件服务器的访问。…
小程序门店自提功能开启,酷客多带你玩转O2O模式
目前小程序的发展已经如火如荼,不管是新型行业还是传统行业,都进军小程序领域,由此为广大消费者带来了方便与快捷,现在许多商家品牌将线上线下结合互动起来,推广门店自提的模式,酷客多小程序(ht…

“基因编辑婴儿”惹争议,你或许不知道机器学习在脱靶效应中的作用?
作者|琥珀出品| AI科技大本营又一次,计算机科学家和生物学者站在一起,对抗人类向内探索的挑战——用机器学习预测基因编辑 CRISPR 中的脱靶效应。今年年初,发表在《自然》生物工程杂志上的一篇论文描述了 Elevation 这项工具。该工具由微软研…

Flash Player漏洞利用Exploiting Flash Reliably
以下消息来自幻影论坛[Ph4nt0m]邮件组前两天推荐过Mark Dowd的Paper “Exploiting Flash Reliably”[url]http://hi.baidu.com/secway/blog/item/242655971275376855fb96d8.html[/url]学习了一下,很好很强大。为以后Flash Player漏洞的利用开辟了一条崭新崭新的道路…

java好用的hbase库_Hbase入库基于java
计划每周写一篇博客,督促自己快点学习,懒惰会让人上瘾,努力奋斗,不忘初心。某天,忽然来任务,要做hbse入库,之前自学过hbase,感觉挺简单的,网上搜了些model直接撸码&#…
linux(ubuntu)环境下安装及配置JDK
安装完IDEA之后遇到了问题,发现jdk安装完之后配置环境变量好困难,下面总结一下我的安装及配置方式: JDK下载链接:http://download.oracle.com/otn-pub/java/jdk/8u144-b01/090f390dda5b47b9b721c7dfaa008135/jdk-8u144-linux-x64.tar.gz 作者…

专访英特尔AIPG全球研究负责人Casimir Wierzynski:物理学、隐私和大脑将根本性塑造AI...
记者|琥珀出品| AI 科技大本营在 11 月 14 日至 15 日在北京召开的英特尔人工智能大会(AIDC)上,英特尔人工智能产品事业部(AIPG)全球研究负责人 Casimir Wierzynski 发表了主题为《人工智能研究——物理学、隐私和大脑…

flash php socket通信_php与flash as3 socket通信传送文件实现代码
前段时间在flashseer看到有人提到:可以通过socket方式传送swf文件,让用户无法获取到swf文件… 当时还没有出as3的反编译,所以对程序的保护没有在意.随着反编译程序的平民化,不希望别人看到源代码的朋友就比较着急…通过socket方式传送swf文件来避免泄漏源代码的思路(只适用as3)…

全线衰退:PC产业一枝孤秀
之三:全线衰退:PC产业一枝孤秀 在3C中,也许个人电脑(PC)产业算是当今中国最有希望的。中国的计算机工业号称已有50年历程,但成为民用产品的起始点应在30年前,与改革开放同时起步。1978年,国家成立了计算机工…

用Gogs在Windows上搭建Git服务
1.下载并安装Git,如有需求,请重启服务器让Path中的环境变量生效。2.下载并安装Gogs,请注意,在Windows中部署时,请下载MiniWinService(mws)版本。3.在MariaDB中创建一个命名为Gogs的数据库&#…

wamp安装多版本php,WampServer安装多个php版本
早期的WampServer安装多个版本php很简单,只需要单击php下的Get more...就行了,WampServer会自动导航到http://www.wampserver.com/addons_php.php下去安装php,但目前这种方式好像不行了,该页面找不到了,那么我们只能手…

利用Windows自带服务架设免费邮件服务器
在Windows Server 2003中带有完整的SMTP和POP3服务,并且能够支持有域和无域两种环境,非常便于中小型企业实施。今天,小编就以Windows Server 2003企业版为例带领大家架设一台免费的邮件服务器,希望能够对各位朋友学习邮件服务器提…

阿里首次开源深度学习框架X-Deep Learning
今年,各企业在开源路上的势头可以说是“你追我赶”,谁也不甘落后。6 月,小米宣布开源自己在移动端深度学习框架 MACE;9 月,腾讯 AI Lab 宣布开源一款自动化深度学习模型压缩与加速的框架——PocketFlow。双十一刚过&am…

应用基于资产的开发到 SOA 的服务中1
SOA 的主要原则之一是在整个 SOA 生命周期中将服务视为可重用资产。因此,务必在 SOA 中对服务应用正式的资产开发流程和指南。本文可帮助 IT 架构师、项目经理和 SOA 管理员全面了解一些主要 IBM 产品如何协作来帮助有效地在 SOA 中将服务作为可重用资产进行创建、使…

用Piranha来实现WEB的负载均衡
简述:利用(LVSPiranha)基于完整开源软件的架构可以提供一个简单的负载均衡及高可用的服务架构。LVS 集群采用 IP 负载均衡技术和基于内容请求分发技术。调度器具有很好的吞吐率(在DR模式下),将请求均衡地转移到不同的服务器上执行,且调度器自动屏蔽掉服务器的故 障,…

SQLServer数据库试题及答案
选择题:(20分) 1、根据关系数据基于的数据模型——关系模型的特征判断下列正确的一项:(___) A、只存在一对多的实体关系,以图形方式来表示。 B、以二维表格结构来保存数据,在…

php中怎样阻止网页进行跳转,阻止php页面跳转方法
阻止php页面跳转方法一、 header 函数header()函数的主要功能是将HTTP协议标头(header)输出到浏览器。参数void header (string string [,bool replace [,int http_response_code]])可选参数replace指明是替换前一条类似标头还是添加一条相同类型的标头,默认为替换。…

张宏江:人工智能的长远发展需要有人坐冷板凳
从金山 CEO 退休两年后,除了在源码资本任职投资合伙人,张宏江又在刚刚成立不久的北京智源人工智能研究院担任首届理事长,致力于推动不同行业分享大数据,让从事基础研究院所和 AI 的创业公司更容易获得数据。作为一个横跨产学研、投…

Python 中的进程、线程、协程、同步、异步、回调(一)
在进一步之前,让我们先回顾一下各种上下文切换技术。 不过首先说明一点术语。当我们说“上下文”的时候,指的是程序在执行中的一个状态。通常我们会用调用栈来表示这个状态——栈记载了每个调用层级执行到哪里,还有执行时的环境情况等所有有关…