微软亚洲研究院副院长刘铁岩:AI如何助力节能减排?
7月10日,在微软举办的WAIC●2020人工智能予力永续未来论坛,微软亚洲研究院副院长刘铁岩围绕 AI 在节能减排领域的应用,探讨了如何推进整个社会的可持续发展。
刘铁岩指出,人工智能在助力节能环保方面具有巨大潜力。例如,为了精确监测污染源,精准高效地治理大气污染,需要估计出细粒度、高精度的污染物排放清单,并针对某种污染物治理方案快速预测其对大气质量改善的效果。微软亚洲研究院与清华大学合作,以“对偶学习”、复合神经网络等新方法快速准确地估算出大气污染物排放清单;并发明了deepRSM 模型,只需要进行一次 CTM 仿真就可以获得精准的预测结果,极大降低了对人力的消耗和对计算资源的需求。这些成果发表于国际顶级期刊《环境科学与技术》,并已被应用于大气污染治理的实战。
人工智能也可能带来一些新的可持续发展的隐患,例如近年来在人工智能领域,人们常常过度依赖于大模型、大数据来保证精度,却因而带来了过度的能源消耗。刘铁岩表示,人工智能是一把双刃剑,我们应该聚焦精巧的算法创新,以事半功倍、低能耗的方式解决问题,这样才能实现真正可持续发展的 AI,也只有这样才能让 AI 技术有资格、有能力去助力其他关键领域如环保、节能等实现技术转型。
以下为刘铁岩演讲内容:
提到环保,大气污染治理是其中一个主要方向。此前,微软承诺到2030年实现负碳排放,到2050年,消除微软自1975年成立以来的碳排放量总和,包括直接排放或因用电产生的碳排放,立足于科学和数学,为微软的碳足迹负责。同时承诺未来四年内投入10亿美元设立一项气候创新基金,帮助加速全球碳减排、碳捕获和碳消除技术的发展。
现阶段一些大气污染治理方式取得了不错的效果,不过在精准度方面还有待进一步提高,不然很容易导致大气污染治理和经济发展之间产生难以调和的矛盾。而实现精准的大气污染治理,面临两个挑战:首先,要知道当前各个地区具体的污染物排放情况,构建一份详细的排放清单;其次,要了解针对某一类特殊排放物或者污染源进行处理之后,它们在多大程度上、会以何种方式去影响最终空气的质量。
两个问题看似简单,实现起来并不容易。以排放清单估计为例,由于污染排放源复杂且不断变化,我们需要理解各种排放物在各个地区每小时的变化,但又无法在每个排放源旁都摆放一个传感器,去采集细粒度、高精度的排放数据。因此当前的排放清单估计,严重依赖于专家根据宏观经济信息进行排放普查,费时费力,缺乏精度保障。据专家估计,该精度只有60%左右。
排放估计机器学习模型:误差降低65%
利用人工智能、机器学习技术自动估计精确的排放清单,可以节省大量人力成本,并且为决策提供更及时、有力的支撑。
首先,我们来构建一个机器学习模型,从大气的污染物分布出发,去预测排放清单。通常我们会需要大量训练数据,这些数据需要包含不同类型的大气污染物分布所对应的排放清单,但这正是我们要通过AI去解决的问题,因为现实中我们无法采集到细粒度、高精度的排放清单,训练数据在这里出现了“鸡生蛋、蛋生鸡”的尴尬局面。
利用人工智能实现排放清单估算
我们注意到,这个问题的背后有一个反向问题,我们可以从排放清单出发,通过推演获得大气中污染物的分布,这个问题的难度则要低得多。这里刚好可以用到微软亚洲研究院近年来所提出的“对偶学习”思想。利用对偶学习,从大气污染物分布出发,经过排放清单,再回到大气污染物分布,形成学习闭环,我们就可以利用对大气污染物预测的误差,来驱动整个学习过程,最终获得排放清单估计模型。
事实上,在环境科学领域,从排放清单推演出大气污染物的分布,已经有一个被广泛使用的系统,叫做化学输送模型(CTM),我们可以把CTM当作对偶学习闭环中的一环,来实现学习过程。不过CTM系统有个小问题,它是一个离散系统,不可求导,因此我们提出构建一个连续可导的函数,用它来逼近CTM系统。考虑到CTM中有非常复杂的化学反应,以及时空的对流扩散等过程,我们选用了一个相对复杂的复合神经网络来实现。在该网络里,我们用CNN实现了对地理位置的编码,用LSTM循环神经网络对时域信息进行编码,用U-Net实现对空间信息的建模。
在过去的一年,我们与清华大学的科学家一起,基于1500个观测站点的排放数据,评测了排放估计模型。实验表明,相比之前的专家估计,机器学习模型不仅节省了大量的人力成本,还把相对的估计误差降低了65%,极大提升了排放清单估计模型的精度。
排放估计模型实验结果
一次CTM仿真,即可获得精准的大气化学反应曲面
当有了相对准确的排放清单估计之后,下一个问题就是,基于这个清单对其中的某种排放物或污染源进行控制,最终会如何影响大气污染物的分布?如果每一次排放控制都经过一次CTM仿真才能获得大气污染物的变化,那几乎要穷举所有的排放状况,才能全面掌握这个问题,这显然不可行。
人们通常采用基于采样的近似曲面估计方法去构建大气化学反应的曲面,可以有效降低CTM仿真的复杂度,但这个曲面的精度和构建曲面时所需要的样本点数目密切相关,而在实践中想得到一个相对细致的大气化学反应曲面,通常要采集几百万个样本点,其中的运算复杂度非常高。
微软亚洲研究院和清华大学合作研发了全新的方法,只需要经过一次CTM仿真就可以获得精准的大气化学反应曲面,这个算法背后的特别之处在于我们对于大气化学反应机理的深刻认识。大气中化学反应通常是可逆的,而且生成物的浓度与反应物浓度之间存在一定的定量关系。这个关系与只依赖于外部条件的一个化学平衡常数K有关,还与一个反应关系函数R有关。因此,我们不需要对每种反应物的浓度进行CTM仿真,只需要在一个基准浓度的CTM仿真基础上,在外部条件不变的前提下,利用这个反应关系函数R直接估计出各种情况下生成物的浓度。在实际操作中,我们用神经网络来对反应关系函数R进行建模,再用一定量的训练数据去学习这个神经网络的参数即可。
预测误差从4.1%下降到2.5%
由于传统基于采样点来逼近化学反应曲面,会受到采样点数目的限制,无法实现完全精准的曲面拟合。而我们的方法利用大气化学反应的本质规律,不存在采样点带来的近似误差。通过测试,新方法不仅节省了用于CTM仿真的大量计算资源,而且在预测精度上还将相对误差降低了近40%。目前,该研究成果已经发表在环境科学领域顶级期刊《环境科学与技术》上,并已被应用于大气污染治理的实战。
关注AI背后的能耗,算法可以更精巧
人工智能是一把双刃剑,一方面它可以帮助解决可持续发展所面临的问题,如前文提到的大气污染与能源损耗,另一方面,人工智能模型的训练本身也要消耗大量资源。近些年人工智能领域有一个令人担忧的现象,就是所谓大力出奇迹——人们过度依赖大模型、大数据去解决人工智能的精度问题,这不可避免要消耗大量能源。
例如,围棋选手AlphaGo在战胜人类世界冠军的背后,是上千块CPU和上百个GPU的消耗;自然语言预处理技术Bert背后需要几十个TPU的支撑,才能够完成一个有效的训练;用于图像生成的大规模对抗生成网络也要消耗几百个GPU。每一个人工智能系统本身,就是资源消耗大户,AI自身的可持续发展问题又该如何解决呢?
作为研究人员,我们不禁自问:人工智能要发挥威力,一定需要消耗巨大的计算资源吗?过去的5年里,我们基于这样的思路,开发了一批高效实用的低功耗人工智能技术,包括让计算复杂度与主题数目无关的高效主题模型LightLDA,只需300个CPU内核,就训练出了比以往要用上万个内核才能训练出的模型还要大若干数量级的新模型;速度快、准确率高、内存要求低、分布式支持还可轻松快速处理海量数据的LightGBM算法,实现了比市场上最好的梯度决策树算法还要快一个数量级的新算法;兼具快速、鲁棒、可控等优点的语音合成算法FastSpeech,将性能最好的语音合成引擎提速了近270倍,而且只需要使用低端GPU就可以实现实时的语音合成服务。
微软亚洲研究院高效的人工智能算法
这些新技术因为低功耗、高效率,或是可以在同样时间内训练出性能更好的机器学习模型,已经应用于微软的多个产品中,也受到了外界的广泛关注。LightLDA模型为必应搜索引擎的上下文广告提供了精细匹配的支持,增加了广告拍卖的密度;LightGBM算法极大程度上推进了人工智能算法的平民化,受到了GitHub社区的青睐,同时也是必应搜索引擎后台的核心技术之一;Fastspeech算法在微软Azure的认知服务中支持15种语言的语音合成,也是市场上语音处理开源软件的主流技术。
这几个来自微软亚洲研究院的高效算法只是一个开始,为了人工智能的可持续发展,我们不仅要关心算法的性能、精度,还要注意其背后的能耗问题。也希望这些算法设计的新角度,可以给大家一些启示,去聚焦精巧的算法创新,做到事半功倍,以多快好省的方式,实现真正可持续发展的人工智能。
只有当人工智能算法本身具有可持续发展性,它才有资格、有能力去助力其他关键领域的技术转型。我们热切地呼吁人工智能领域的研究人员和从业者共同努力、精诚合作,用可持续发展的人工智能技术去真正推动人类社会的可持续发展。
相关文章:

如何在域控制器上安装asp.net?
作者:网际浪子专栏(曾用名littlehb) http://blog.csdn.net/littlehb/在域控制器或备份域控制器上安装 Microsoft Visual Studio .NET 或 Microsoft .NET 框架后,如果您尝试运行 ASP.NET 应用程序,则浏览器…

前端思想实现:面向UI编程_____前端框架设计开发
引子,我去小说看多了,写博客竟然写引子了!!!不过,没引子不知道怎么写了。言归正传吧,前端这个职业,也就这几年刚刚火起来的职业,以前那个混乱的年代,前端要么…

如何检查当TextBox设置为多行时是不是超长了?
<asp:RegularExpressionValidator id"revTextBox1" runat"server" ForeColor"Red" Display"Dynamic" ControlToValidate"textBox1" ValidationExpression"(/w|/W){1,100}">格式错误-只能输入不超过100个字符…
仅用2年过渡到自研ARM芯片,苹果的底气从何而来?
作者 | Steven Sinofsky译者 | 弯月,责编 | 屠敏题图 | 东方 IC出品 | CSDN(ID:CSDNnews)今年 WWDC 2020 上,苹果宣布自研 ARM 芯片——Apple Silicon,对于苹果而言,Apple Silicon很重要&#…

从“创业输家”到“创智赢家”
年轻就是创业的资本,但同时还要不怕失败,经得起挫折!”在上海财经大学的演讲厅内,彭震以自己亲身的经历,向在场的学生们介绍了自己创业背后的艰辛。彭震,现任项丰投资公司董事长,作为首届“ 创智…

2.正则表达式
在计算机科学中,正则表达式是这样解释的:它是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。许多程序设计语言都支持利用…
基于监督学习+自监督学习的智能抠图,精确到发丝 | CVPR 2020
来源 | AI算法与图像处理(ID:AI_study)华盛顿大学的研究者最近发表的论文在CVPR 2020提供了一个新的和简单的智能抠图方法。你可以在家里做这些日常设置,使用固定或手持相机。我们的方法也是最先进的,给出的输出可比专业的结果。在…

安装Jpype
1、下载JPype-0.5.4.2 2、 python setup.py install error: gcc -pthread -fno-strict-aliasing -DNDEBUG -O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE2 -fexceptions -fstack-protector --paramssp-buffer-size4 -m64 -mtunegeneric -D_GNU_SOURCE -fPIC -fPIC -I/usr/lib/jvm…

SQL SERVER中带参数的返回
作者:网际浪子专栏(曾用名littlehb) http://blog.csdn.net/littlehb/ CREATE PROCEDURE LoginUser loginUN char(50) OUTPUT, loginPW char(40)ASif loginPW (select [password] from users where usernameloginUN) return 0;else ret…

Android Studio 编译单个module
前期自己要把gradle环境变量配置好 在Terminal中gradle命令行编译apk 输入gradle assembleRelease 会编译全部module编译单个modulecd ./xiruan //xiruan是module的名字 //意思是进入module目录gradle assembleRelease //编译出自己签名的apk //签名环境也要配置好gradle ass…

linux下文件字符集转化实战篇
linux下文件字符集转化实战篇------------------------------------------为什么转换编码,起因:分析应用程序日志,文件编码格式gb2312(含中文字符),通过linux shell脚本从日志中提取出需要的字段并生成有固…

如何得到数据库中所有表字段及字段中文描述
如何得到数据库中所有表字段及字段中文描述以下资料,通过csdn的一位师兄从SQL版主那得到:sql中SELECT (case when a.colorder1 then d.name else end) N表名, a.colorder N字段序号, a.name N字段名, (case when COLUMNPROPERTY( a.id,a.name,IsIdentity)1 then √else end)…
它估值25亿!被马云领投,是华为“老战友”,网友:也许股价能超茅台!
最近一条新闻被炒的沸沸扬扬:十年以来中国最大IPO,中芯国际将融资532亿元!何为IPO?翻译即为一家公司第一次向全社会公开售出它的股份。买的人越多,代表着社会对其信心越大。为什么2020年,能爆发这样1场最大…

改變人生的21種好習慣
當一個人生活枯燥的時候, 他忘了用心體會是一種習慣。 當一個人覺得人生乏味的時候, 他忘了培養幽默是一種習慣。 當一個人體力日差的時候, 他忘了運動建身是一種習慣。 當一個人工作疲憊的時候, 他忘了認真休息是一種習慣。 當一…
Python 编程语言的核心是什么?
作者 | Brett Cannon译者 | 弯月,责编 | 王晓曼头图 | CSDN下载自视觉中国出品 | CSDN(ID:CSDNnews)为什么要问这个问题?我想要用Python实现WebAssembly,这并不是什么秘密。这不仅可以让Python进入浏览器&a…

关闭页面不用提示的方法
Response.Write("<script>window.openernull;window.close();</script>") ;

VIM 必知必会12大类型操作
2019独角兽企业重金招聘Python工程师标准>>> VIM是在unix/linux系统下最常用的文本编辑器,呵呵……这就不用我再强调了,现在直接贴上vim的最常用的操作,方便日后温习及查阅! 1、插入 i 在光标前插入 I 在行首插入 a 在光标后插入 …

前后端分离的思考与实践(三)
Midway-ModelProxy — 轻量级的接口配置建模框架前言使用Node做前后端分离的开发模式带来了一些性能及开发流程上的优势(见《前后端分离的思考与实践 一》), 但同时也面临不少挑战。在淘宝复杂的业务及技术架构下,后端必须依赖Java搭建基础架构,同时提供…

替换HTML代码
将一些HTML替换掉 eg:strContentstrContent.Replace("&","&");strContentstrContent.Replace("","");strContentstrContent.Replace("<","<");strContentstrContent.Replace(">&quo…

什么是线程安全?
http://baike.baidu.com/view/1298606.htm 线程安全 目录 什么是线程安全?举例线程安全性线程安全程度不可变线程安全有条件的线程安全线程兼容线程对立什么是线程安全?举例线程安全性线程安全程度不可变线程安全有条件的线程安全线程兼容线程对立展开编…
中国开源大爆发进行时,你没掉队吧?
作者 | 陈利鑫头图 | CSDN 下载自东方 IC出品 | CSDN(ID:CSDNnews)从开源(Open Source)一词提出到如今,开源的概念越来越成熟,作为一种创造及协作模式,开源已经不仅仅局限于软件技术…

eclipse设置
2019独角兽企业重金招聘Python工程师标准>>> eclipse 下载 地址 http://www.eclipse.org/downloads/packages/release/Ganymede/SR2 设置 jdk 参数 jre definition vm arguments -Xms800m -Xmx800m -XX:MaxNewSize256m -XX:MaxPermSize256m -Dfile.encod…
吊打一切:YOLOv4的tricks汇总
来源 | AI算法与图像处理(ID:AI_study)即使是目标检测在过去几年开始成熟,竞争仍然很激烈。如下所示,YOLOv4声称拥有最先进的精度,同时保持高处理帧速率。它在 MS COCO数据集上,使用Tesla V100以接近65 FPS…

如何播放RM文件?
<EMBED SRC"MY_LIFE.RPM" WIDTH300 HEIGHT134 >Tip:SRC是可以省略的,当mime Type 参数如下时:<EMBED ...,TYPE"audio/x-pn-realaudio-plugin",...>,这样做会产生不可预料的结果,因此强烈推荐你包…

mongodb地理位置索引实现原理
地理位置索引支持是MongoDB的一大亮点,这也是全球最流行的LBS服务foursquare 选择MongoDB的原因之一。我们知道,通常的数据库索引结构是B Tree,如何将地理位置转化为可建立BTree的形式,下文将为你描述。 首先假设我们将需要索引的…

NSMakeRange基础函数应用
NSRange NSMakeRange (NSUInteger loc,NSUInteger len );这是官方得接口描述。loc 为location缩写,len 表示长度。作用:在loc指定得位置开始往后获取len长度个得元素。示例程序使用这个函数来为指定数组得某个位置向后指定长度得元素集合。如NSRange NSM…

上传图片,要求图片200100象素,大小小于2M
作者:网际浪子专栏(曾用名littlehb) http://blog.csdn.net/littlehb/上传图片,要求图片200100象素,大小小于2M,如果图片不符合要求,不能上传,否则上传图片,上传以后对图…
炸裂!这些大厂跪求的人才太牛了!
今年所有的互联网公司都在ALL in AI,百度、腾讯、阿里巴巴、京东等互联网巨头都在四处挖掘AI人才。AI的岗位需求很多,几乎每天都有数百个JD放出。而亿欧智库发布的《2020全球人工智能人才培养研究报告》提到,近4年AI人才的需求量以每年74%的速…

新春祝福必杀计之发送短信攻略
新的一年就要到了,陆陆续续的收到很多同事们的短信祝福,哎,不能欠人家的人情债啊,但是我实在是个懒人啊,这个祝福短信还是要回复的啊,我的手机里有超过百位联系人,全是和工作有关的,…
centos6.5环境DNS-本地DNS主从服务器bind的搭建
centos6.5环境DNS-本地DNS主从服务器bind的搭建在上一篇博客中我已经搭建好了一个本地DNS服务器,能够实现正向反向解析,那么我们只需要加入一台从DNS服务器即可完成,我们来开始配置主从服务器:一.主DNS服务器上面的额外…