当前位置: 首页 > 编程日记 > 正文

只会高中数学运算就能发现算法?Google开源的AutoML-Zero有多厉害


译者 | 刘畅

出品 | AI科技大本营(ID:rgznai100)

机器学习研究,已经在多个方面都取得了进步,包括模型结构和优化方法等。而使此类研究自动化的工作(称为AutoML)也有重大进展。这一进展主要集中在神经网络的体系结构,神经网络目前主要是依赖于专家设计复杂的层来构建块(或类似的限制性搜索空间)。


本文的目标是证明AutoML可以走得更远。如今有可能仅使用基本的数学运算作为构建块就可以自动发现完整的机器学习算法。


本文介绍了一种新的框架来证明这一点,该框架使用了一个更一般的搜索空间,这可以显著减少主观设计意愿。尽管搜索空间很大,但是进化搜索仍然可以发现使用反向传播训练的两层神经网络。然后,在一些任务上可以超越这些简单的神经网络。即使这些网络用了目前顶级的优化算法,如归一化梯度、权重平均等。


此外,这种搜索可以使算法适应不同类型的任务:例如,当可用数据很少时会出现类似dropout的效果。我们相信从零开始发现机器学习算法的初步成功,为该研究领域指明了一个十分有希望的新方向。

引言

近年来,神经网络在许多关键的任务上取得了卓越的性能。对机器学习研究的时间长度和难度催生了一个名为AutoML的新领域,该领域是为了通过花费机器计算时间而不是人类研究时间来使机器学习技术进步。这项工作取得了丰硕的成果,但到目前为止,现在的研究均严重依赖于人类设计的搜索空间。一个常见的例子就是神经网络架构搜索,它由专家设计的复杂层来作为构建块,并遵守反向传播的规则来限制搜索空间。

类似地,其他AutoML研究也找到了将搜索空间限制在单一算法内的方法,例如反向传播期间使用的学习规则,LSTM的门控结构或数据增广;在这些研究工作中,所有其他的算法仍然是手工设计的。这种方法可以节省计算时间,但是有两个缺点。首先,人为设计的块结构会使搜索结果偏向于人为设计的算法,这可能会降低AutoML的创新能力。更少的选择项也限制了创新,因为无法发现无法搜索的内容。其次,受约束的搜索空间需要精心组合,从而给研究人员带来新的负担,并违背了所谓的节省人类时间的目标。

为了解决这个问题,本文提出了仅使用少量限制和简单数学运算模块的自动搜索所有机器学习算法的方法。我们将这种方法称为AutoML-Zero,它的目的是为了以最少的人为参与进行学习。

换句话说,AutoML-Zero旨在同时搜索细粒度空间的模型,优化过程,初始化等操作,从而减少了人工设计的工作量,甚至可以发现非神经网络算法。为了证明这一点在如今是可行的,本文提出了针对这一挑战的初步解决方案。

AutoML-Zero搜索空间的通用性使其比现有的AutoML算法对应空间搜索更难。现有的AutoML搜索空间已经构建了密集且具有良好的解决方案,因此不再强调搜索方法本身。例如,在同一搜索空间上进行比较发现,领先的技术通常仅比简单随机搜索(RS)略胜一筹。

而AutoML-Zero有所不同:由于搜索空间是更广泛的,以致最终结果变得十分稀疏。我们提出的框架将机器学习算法表示为包含三个分量函数的计算机程序,这些功能一次可以对一个样本进行预测和学习。这些函数中的指令将基本的数学运算赋于内存中。每个指令使用的操作和存储器地址都是搜索空间中的自由参数,分量函数的大小也是如此。

总的来说,本文的贡献是:

  • AutoML-Zero,可以用最少的人工参与,从头开始自动搜索ML算法;

  • 带有源代码和仅结合基本数学运算搜索空间的新框架;

  • 详细的实验结果,显示了使用进化搜索算法发现ML算法的潜力。

代码地址:

https://github.com/google-research/google-research/tree/master/automl_zero#automl-zero

方法

AutoML-zero方法可以分为两个部分来讲,一是搜索空间,二是搜索方法。

搜索空间

作者将算法表示为在较小的虚拟内存上起作用的计算机程序,这些虚拟内存具有用于标量,向量和矩阵变量的单独地址空间。所有这些都是浮点数,并且共享任务输入特征图的维度。

作者将程序表示为一系列指令。每个指令都有一个确定其功能的操作,为了避免选择操作的偏向性,本文使用了一个简单的标准:需要由高层次的学习来确定。作者有目的地排除了机器学习概念,矩阵分解和导数。

受监督学习工作的启发,作者将算法表示为具有三个分量函数的程序,Setup/Predict/Learn。如下图所示:

下图的进化过程对上述函数的使用进行了阐释。在下图中,两个for循环实现了训练和验证阶段,为简单起见,一次处理一个样本。训练阶段会交替执行“预测”和“学习”。

搜索方法

搜索实验必须通过修改分量函数中的指令来发现机器学习算法。本文使用了正则化进化搜索方法,这是因为它十分简单,而且最近在架构搜索方面取得了不错的成绩。此方法如下图所示。

由父代产生子代的突变必须针对搜索空间进行定制;本文在三种类型的动作中使用了随机选择:(i)在分量函数中的随机位置插入随机指令或删除指令,(ii)将分量函数中的所有指令随机化,或(iii)通过将指令替换为随机选择来修改指令的参数之一。如下图所示。

实验

在接下来的实验部分中,本文将分别回答以下三个问题:“搜索AutoML-Zero空间有多困难?”,“可以使用本文的框架以最少的人工输入来发现合理的算法吗?”,以及“可以通过改变搜索实验中使用的任务类型来发现不同的算法吗?”

1、在搜索空间中寻找简单的神经网络

下图总结了对4种任务类型的分析结果:发现一个完整的算法/仅学习线性的方法/仿射回归数据。AutoML-Zero搜索空间是通用的,但这是有代价的:即使对于一些简单的任务,好的算法也是稀疏的。随着任务变得越来越困难,解决方案变得越来越稀疏,并且其性能大大优于RS。

2、用最少的人工输入进行搜索

通过搜索发现了线性回归、带有反向传播的双层神经网络,甚至是超过手工设计的复杂度相当的基线算法。上面的图显示了我们实验中的一个例子,可以看到演化算法是如何来一步步解决二分类任务的。首先是个线性模型,没有任何优化方法,然后逐步发现了 SGD 来进行优化,接着开始加入随机的学习率,再往后发现了ReLU激活函数,随机权重初始化,梯度归一化等等,越来越接近手工设计的网络结构和优化方法。

3、发现算法的普适性

在本节中,作者将通过搜索三种不同的任务类型来展示本文方法更广泛的适用性。每种任务类型都会有自己的挑战(例如“数据太少”)。我们将展示进化适应算法应对挑战的过程。由于我们已经从头开始获得了合理的模型,因此现在只需使用下图的有效神经网络初始化种群即可,这可以节省时间。

总结

在本文中,作者为AutoML提出了一个宏伟的目标:从基本的操作中自动发现整个ML算法,通过减少人在搜索空间带来的偏好,希望这最终会产生新的ML内容。


本文构建了一个表示ML算法的新框架来证明该研究方向的潜力,该算法将ML算法表示为由三个分量函数(Setup,Predict,Learn)组成的计算机程序。从空的分量函数开始,仅使用基本的数学运算,本文算法逐步演变出了线性回归,神经网络,梯度下降,权重平均,归一化梯度等。这些结果显示该算法是十分有希望的,但仍有许多工作要做。

论文地址:

https://arxiv.org/abs/2003.03384

推荐阅读

  • 前百度主任架构师创业,两年融资千万美元,他说AI新药研发将迎来黄金十年

  • 北京四环堵车引发的智能交通大构想

    “手把手撕LeetCode题目,扒各种算法套路的裤子”

  • 一站式杀手级AI开发平台来袭!告别切换零散建模工具

  • 平台抗住日访问量 7 亿次,研发品控流程全公开

  • 你公司的虚拟机还闲着?基于 Jenkins 和 Kubernetes 的持续集成测试实践了解一下!

  • MQ技术产品井喷,今天来详聊一下腾讯开源消息中间件TubeMQ

  • 你点的每个“在看”,我都认真当成了AI

相关文章:

Tsar安装使用

Tsar是淘宝开发的一个非常好用的系统监控工具,在淘宝内部大量使用,它不仅可以监控CPU、IO、内存、TCP等系统状态,也可以监控Apache,Nginx/Tengine,Squid等服务器状态。值得一提的是,Tsar 支持将数据存储到 …

《虚拟化与云计算》读书感(四)数据中心的设计和构造

任何大型系统的设计和构造都是一项复杂的过程,数据中心的的设计和构造也是一项系统的工程,需要人们相互协作来完成总体的设计、建筑和基础设施的构建,以及软硬件的采购和上线。几天我看的书中这一节主要是将如何总体设计和构造以及要做的工作…

C 的大致运行原理。

// 尽量多上干货。我是Xcode 运行环境。 // 这些简单的我就写的 少些 。 任何一个C语言程序都是由一个或者多个程序段(小程序)构成的,每个程序段都有自己的功能,我们一般称这些程序段为“函数”。 函数有 声明(定义) 和 使用&…

Spring AOP与IOC以及自定义注解

Spring AOP实现日志服务 pom.xml需要的jar <dependency><groupId>org.apache.commons</groupId><artifactId>commons-lang3</artifactId><version>3.4</version> </dependency> <dependency><groupId>org.spring…

小白也能看懂:一文学会入门推荐算法库 surprise

来源 | 机器学习与推荐系统surprise 支持的每个算法本身思路并不复杂&#xff0c;代码也不晦涩难懂&#xff0c;我们主要的目的是理解它的架构&#xff0c;学习框架各个部分的交互。这篇文章是想从一个整体的视角&#xff0c;以作者最初的思路为主线进行介绍&#xff0c;观察并…

开发人员必备网站

http://www.gotapi.com/语言&#xff1a;英语简介&#xff1a;HTML,CSS,XPATH,XSL,JAVASCRIPT等API的查询网站。http://www.w3schools.com/语言&#xff1a;英语简介&#xff1a;W3C制定的标准诸如XML,HTML,XSL等等的在线学习教程。http://www.xml.org.cn/语言&#xff1a;中文…

iOS实现依赖注入

依赖注入(Dependency Injection)这个词&#xff0c;源于java&#xff0c;但在Cocoa框架中也是十分常见的。举例来说&#xff1a;UIView的初始化方法initWithFrame - (id)initWithFrame:(CGRect)frame NS_DESIGNATED_INITIALIZER; 这里的frame传入值&#xff0c;就是所谓的依赖(…

shell语法以及监控进程不存在重启

转码 # dos2unix ./test.sh 权限 # chmod ax ./test.sh语法变量var"111"echo $varecho ${var}运算no14;no25;let resultno1no2echo $result;自增自减少let no let no--[]和let类似result$[ no1 no2 ]result$[ $no1 5 ]也可以使用(())&#xff0c;但使用(())时&…

当莎士比亚遇见Google Flax:教你用​字符级语言模型和归递神经网络写“莎士比亚”式句子...

作者 | Fabian Deuser译者 | 天道酬勤 责编 | Carol 出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;有些人生来伟大&#xff0c;有些人成就伟大&#xff0c;而另一些人则拥有伟大。—— 威廉莎士比亚《第十二夜》在几个月前&#xff0c;谷歌的研究人员介绍了机器学习…

netbackup错误之can not connect on socket(25)

rhel5.5上安装netbackup 7.0&#xff0c;这个版本只能安装在64位系统上。安装完netbackup 7.0后&#xff0c;发现登录界面一直报java认证失败&#xff0c;查看了下日志文件&#xff0c;报如下内容&#xff1a; 查了下系统设置&#xff0c;发现/etc/hosts文件里的主机名对应的IP…

支撑Spring的基础技术:泛型,反射,动态代理,cglib等

1.静态代码块和非静态代码块以及构造函数 出自尚学堂视频&#xff1a;《JVM核心机制 类加载全过程 JVM内存分析 反射机制核心原理 常量池理解》 public class Parent {static String name "hello";//非静态代码块{System.out.println("1");}//静态代码块…

深度干货!如何将深度学习训练性能提升数倍?

作者 | 车漾&#xff0c;阿里云高级技术专家顾荣&#xff0c;南京大学副研究员责编 | 唐小引头图 | CSDN 下载自东方 IC出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;近些年&#xff0c;以深度学习为代表的人工智能技术取得了飞速的发展&#xff0c;正落地应用于…

VIM变IDE

2019独角兽企业重金招聘Python工程师标准>>> 根据这篇博文写了个脚本&#xff0c;简单的解压插件和复制配置&#xff0c;可以帮大家快速配置一个VIM。 脚本中使用rpm安装ctags&#xff0c;所以只支持redhat系的&#xff0c;debian系的要自己安装ctags. 脚本放在gith…

Netbeans使用maven下载源码

如果需要研究源码&#xff0c;自然需要下载源码&#xff0c;其实Netbeans使用maven构建项目下载源码非常简单。 springmvc一开始没有下载源码 commons-lang3是下了源码的&#xff0c;下面是对其调用的代码 可以看到点开其代码是源码&#xff0c;也可以打断点 开一个调试 下载源…

讯飞智能语音先锋者:等到人机交互与人类交流一样自然时,真正的智能时代就来了...

作者 | 夕颜出品 | CSDN&#xff08;ID:CSDNnews&#xff09;「AI 技术生态论」 人物访谈栏目是 CSDN 发起的百万人学 AI 倡议下的重要组成部分。通过对 AI 生态顶级大咖、创业者、行业 KOL 的访谈&#xff0c;反映其对于行业的思考、未来趋势的判断、技术的实践&#xff0c;以…

今天看到两个题 写出来思考一下

数组中已有升序的6个数,输入一个数插入到数组中该数组仍然升序. 1&#xff0c;6&#xff0c;9&#xff0c;23&#xff0c;56&#xff0c;95 输入一个数 50 输出 1&#xff0c;6&#xff0c;9&#xff0c;23&#xff0c;56&#xff0c;50&#xff0c;95 题目二 输入一个…

android开发之动画的详解 整理资料 Android开发程序小冰整理

2019独角兽企业重金招聘Python工程师标准>>> /** * 作者&#xff1a;David Zheng on 2015/11/7 15:38 * * 网站&#xff1a;http://www.93sec.cc * * 微博&#xff1a;http://weibo.com/mcxiaobing * * 微博&#xff1a;http://weibo.com/93sec.cc */ 个人交流QQ9…

框架源码学习笔记

1.WebListener Servlet3.0提供WebListener注解将一个实现了特定监听器接口的类定义为监听器&#xff0c;这样我们在web应用中使用监听器时&#xff0c;也不再需要在web.xml文件中配置监听器的相关描述信息了。 Web应用启动时就会初始化这个监听器 WebListener public class M…

20万个法人、百万条银行账户信息,正在暗网兜售

导语&#xff1a;推特用户爆料&#xff0c;暗网上正在出售大量中国数个银行的账号信息&#xff0c;经记者调查&#xff0c;本次打包售价 3999 美金中包含 90 万条中国农业银行账号信息&#xff0c;另外一账号还宣称出售二十个数据包&#xff0c;其中包括百万条银行账号数据、12…

2010年9月blog汇总:敏捷个人和模型驱动开发

9月份指标产品开发开始同时进行两个客户的开发&#xff0c;所以考虑了客户化如何开发的问题&#xff1b;在企业定额产品上&#xff0c;参与清单综合单价库的产品架构并做了用户调研前期准备工作&#xff1b;再就是整理了一下模型驱动开发理论以及思考了OpenExpressApp的几个建模…

Tomcat的配置及优化

Tomcat 服务器是基于Apache 软件基金会项目开发的一个免费的开放源代码的Web 应用服务器它是开发和调试JSP 程序的首选&#xff0c;主要用在中小型系统和并发访问用户不是很多的场合&#xff0c;实际Tomcat 部分是Apache 服务器的扩展&#xff0c;但它是独立运行的&#xff0c;…

JAX-WS Web 服务开发调用和数据传输分析

一. 开发服务 新建maven的web项目就可以了&#xff0c; 1.新建一个web服务 2.服务名称定义 3.更改配置 4.默认建好的服务文件 5.增加一个add的服务 import javax.jws.WebService; import javax.jws.WebMethod; import javax.jws.WebParam;/**** author Administrator*/ WebSer…

如何在高精度下求解亿级变量背包问题?

导读&#xff1a;国际顶级会议WWW2020将于4月20日至24日举行。始于1994年的WWW会议&#xff0c;主要讨论有关Web的发展&#xff0c;其相关技术的标准化以及这些技术对社会和文化的影响&#xff0c;每年有大批的学者、研究人员、技术专家、政策制定者等参与。以下是蚂蚁金服的技…

收集到的一些网络工程师面试题 和大家分享下

1: 交换机是如何转发数据包的?交换机通过学习数据帧中的源MAC地址生成交换机的MAC地址表&#xff0c;交换机查看数据帧的目标MAC地址&#xff0c;根据MAC地址表转发数据&#xff0c;如果交换机在表中没有找到匹配项&#xff0c;则向除接受到这个数据帧的端口以外的所有端口广播…

incompatible with sql_mode=only_full_group_by

使用mysql 5.7.11-debug Homebrew时报错 错误信息如下&#xff1a; 26 Mar 2016 09:35:23,432 ERROR org.hibernate.engine.jdbc.spi.SqlExceptionHelper:147 - Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated column ‘tv2.t_pic_news…

Java动态加载一个类的几种方法以及invoke

一.加载一个类的几种方法 接口 IUser package org.me.javaapp;/**** author Administrator*/ public interface IUser {}User.java /** To change this license header, choose License Headers in Project Properties.* To change this template file, choose Tools | Templ…

今晚20:00 | 港科大郑光廷院士详解人工视觉技术发展及应用

阳春三月&#xff0c;万象更新&#xff0c;2020年注定是不平凡的一年&#xff01;有激荡就会遇见变革&#xff0c;有挑战就会迎来机遇。今天总会过去&#xff0c;未来将会怎样&#xff1f;香港科大商学院内地办事处重磅推出全新升级的《袁老师访谈录》全新系列【问诊未来院长系…

Openoffice 安装与配置

1、软件下载 路径&#xff1a;http://download.openoffice.org/ 2、软件安装 [rootOpenbo linux]# tar zxvf OOo_3.2.1_Linux_x86_install-rpm-wJRE_zh-CN.tar.gz[rootOpenbo linux]# cd OOO320_m18_native_packed-1_zh-CN.9502/[rootOpenbo OOO320_m18_native_packed-1_zh-CN.…

比较分析与数组相关的sizeof和strlen

// 形如&#xff1a; int a[]{1,2,3,4,5}; char name[]"abcdef";无论是整型数组还是字符数组&#xff0c;数组名作为右值的时候都代表数组首元素的首地址。数组发生降级&#xff08;数组名退化为数组首元素的地址&#xff09;的情况&#xff1a;数组传参、数组名参与…

Python正则表达式,看这一篇就够了

作者 | 猪哥来源 | 裸睡的猪&#xff08;ID: IT--Pig&#xff09;大多数编程语言的正则表达式设计都师从Perl&#xff0c;所以语法基本相似&#xff0c;不同的是每种语言都有自己的函数去支持正则&#xff0c;今天我们就来学习 Python中关于 正则表达式的函数。re模块主要定义了…