当前位置: 首页 > 编程日记 > 正文

“机器学习还是很难用!”

作者 | Caleb Kaiser

译者 | 香槟超新星,责编 | 郭芮

出品 | CSDN(ID:CSDNnews)

我是一名Cortex贡献者,Cortex是一个用于在生产中部署模型的开源平台。首先声明,以下内容是基于我对一些机器学习团队的观察总结出来的,而不是一份针对该行业的学术调查。

用一个在软件行业中无处不在的东西举例子吧,就比如数据库。建立一个数据库意味着什么?对于一名Postgres贡献者来说,“创建一个数据库”就像一百万行C代码。对于一名Rails开发者来说,看起来就仅仅是一句rake db:create。

显然,二者都没错,只不过它们代表的抽象级别不同,适用于不同工程师的不同侧重点。

这就是软件构建自己的方式。为现代应用程序提供支持的基本软件——数据库、Web服务器、请求路由器、哈希库等等——在很大程度上得到了广泛传播,是因为它们的抽象层使得非专业人士也可以访问它们。

机器学习历来缺乏这种抽象层,这限制了它的采用率。但是现在,情况正在发生变化。新的一波专门致力于让机器学习应用起来更容易的项目正在出现。

模型需要一个对开发人员来说更友好的界面

想要在生产环境中应用机器学习,你需要:

  • 设计模型方面的专业知识

  • 足够的数据以及资金来训练你的模型

  • ML基础架构知识(用于部署模型)

这样的结果就是,任何使用ML的项目都需要由数名专家来亲自执手。这个瓶颈亟待消除。

应该让那些没有机器学习背景的开发人员也能够在生产中使用机器学习才对,就像一名开发人员可能没有密码学方面的背景,但仍然可以用哈希库来保护用户数据一样。

幸好,这终于要发生了。

弥补机器学习抽象的缺失

为了使ML的应用得到普及,开发人员必须能够对机器学习有一个较高水平的了解——什么是模型、微调、推论等等——并通过可用的抽象来构建应用。

许多必要的抽象已经在研究中了,它们属于几个关键的重点领域:

1.我们需要一种更简单的方法来训练模型

现实情况是,对于许多应用机器学习的用例而言,根本不需要从头开始训练新模型。

例如,如果你正在开发一个会话代理,那么几乎可以肯定的一点就是,Google的Meena会表现得比你的模型更好。如果你正在开发一个文本生成器,那你应该去用OpenAI的GPT-2,而不是自己从头开始构建。对于对象检测来说,YOLOv3这样的模型可能是你最好的选择。

得益于转移学习(transfer learning,将神经网络的“知识”微调到一个新领域的过程),你可以只用相对少的数据,就能依据你的任务来对这些开源的最新模型进行微调。

例如,有了gpt-2-simple这样的新库,你就可以使用简单的命令行界面来微调GPT-2了:

$ gpt_2_simple finetune your_custom_data.txt

有了这一抽象层,开发人员就不需要深入了解ML的专业知识了,他们只需要知道如何微调就可以了。

而且可用的训练抽象远不止gpt-2-simple一个。Google Cloud AutoML为用户提供了一个GUI(用户图形界面),可以让用户选择自己的数据集并自动训练一个新模型,无需编写代码:

图源:Google Cloud Vision

Sundar Pichai在一篇有关AutoML的文章中说:“当今需要汇集几位博士才能设计新的神经网络,而我们希望AutoML在三到五年内能够让成千上万的开发人员们都能为他们自己的特殊需求设计新的神经网络。”

2.从模型生成预测的过程必须要简单

好的,假如说已经可以轻松地针对你的特定任务得到一个训练好的模型了。你要如何根据该模型生成预测呢?

能够提供模型服务功能的项目有很多,其中许多都与流行的ML框架相关。例如,TensorFlow有TF Serving,而ONNX有ONNX Runtime。

除了科技巨头们之外,还有许多独立的开源项目也在专注于解决这个问题。例如,Bert Extractive Summarizer项目可以让使用Google的BERT提取文本摘要的过程变得更加轻松。以下是文档中的示例:

from summarizer import Summarizerbody = 'Text body that you want to summarize with BERT'
body2 = 'Something else you want to summarize with BERT'
model = Summarizer()
model(body)
model(body2)

使用该库生成预测的过程就像使用一个import语句以及调用一次Summarizer()一样简单。

随着有越来越多这样的项目的启动以及开发,开发人员无需过多深入了解模型本身就能更轻松地用模型生成预测了。

3.模型的部署必须要简单

最后的瓶颈是基础架构。

为一个玩具应用程序提供预测是简单而直接的,但是当你的程序需要扩大规模时,情况就会变得困难起来。以GPT-2为例:

  • GPT-2大于5 GB。你需要一台更大的,那么也就必定更贵的服务器来托管这么大的模型。

  • GPT-2非常吃算力。为了提供单个预测,GPT-2可以100%的利用率占用CPU数分钟。即使有GPU,单个预测仍可能需要花费数秒。对比之下,Web app只需用一个CPU就能够为数百个并发用户提供服务。

  • GPT-2非常吃内存。除了巨大的磁盘空间和计算需求之外,GPT-2还需大量的内存才能保证运行而不会崩溃。

为了应对少量的用户增长,你也需要将基础架构扩展到应用程序的许多副本。这意味着需要使用Docker对模型进行容器化,使用Kubernetes对容器进行编排,以及通过你使用的云平台来配置自动扩展(autoscaling)。

你需要学会一整套工具才能搭建好用于处理机器学习部署的基础架构,而大多数不具备专业背景的开发人员对其中很多工具都太不熟悉:

机器学习基础架构技术栈

为了让开发人员能够使用机器学习,需要对机器学习的基础结构进行抽象化。这就是像Cortex这样的项目登场的时候了。(完整披露:我是一名Cortex贡献者)。

Cortex通过一个配置文件以及一个命令行界面对模型部署的基础开发进行了抽象:

资料来源:Cortex Repo

Cortex这类项目的目标很简单:拿出一个训练后的模型,并将其转化为任何开发人员都能用的预测API。

让应用型机器学习轻松起来

我想讲清的一点是,机器学习背后的数学原理将永远都是很难懂的。只会调用个predict()函数的话,是不可能成为机器学习专家的。重点是,一名开发人员不必非得成为一名机器学习专家,就可以在自己的应用程序中使用ML。

机器学习的生态社区终于要将重心放在简化应用型ML上了。仅会一点机器学习知识的开发人员可以对最新模型进行微调,将其包装在API中,并使用开源,直观的抽象将其部署在可扩展的基础架构上。

结果就是,应用型机器学习将变得更加容易——而且通过这种扩展,几乎所有开发者都能用得上机器学习了。

原文:https://towardsdatascience.com/machine-learning-is-still-too-hard-to-use-e344773725af

作者简介:Caleb Kaiser,Cortex Labs创始团队。

本文为CSDN翻译文章,转载请注明出处。

【END】

推荐阅读

  • 前百度主任架构师创业,两年融资千万美元,他说AI新药研发将迎来黄金十年

  • 北京四环堵车引发的智能交通大构想

  • 400 多行代码!超详细中文聊天机器人开发指南 | 原力计划

  • 一站式杀手级AI开发平台来袭!告别切换零散建模工具

  • 你知道吗?其实 Oracle 直方图自动统计算法存在这些缺陷!(附验证步骤)

  • 你公司的虚拟机还闲着?基于 Jenkins 和 Kubernetes 的持续集成测试实践了解一下!

  • 从 Web 1.0到Web 3.0:详析这些年互联网的发展及未来方向

  • 你点的每个“在看”,我都认真当成了AI

相关文章:

silverlight 无法发布 如何灵活配置IP

灵活配置IP可以有一个工具的 我为了比赛花了 两天工具做了一个配置Silverlight IP的小工具 可以参考 http://download.csdn.net/source/2714688

使用GoAccess分析Nginx日志

下载 GoAccess 的源代码、编译和安装: http://www.goaccess.io/download # wget http://tar.goaccess.io/goaccess-0.9.6.tar.gz# tar -xzvf goaccess-0.9.6.tar.gz# cd goaccess-0.9.6/# ./configure --prefix/usr/local/goaccess --enable-geoip --enable-utf8#…

STM32中GPIO的8种工作模式

一、推挽输出:可以输出高、低电平,连接数字器件;推挽结构一般是指两个三极管分别受两个互补信号的控制,总是在一个三极管导通的时候另一个截止。高低电平由IC的电源决定。形象点解释:推挽,就是有推有拉&…

深挖谷歌 DeepMind 和它背后的技术

作者 | James Murphy译者 | 天道酬勤 责编 | Carol出品 | AI科技大本营(ID:rgznai100)人工智能(AI)的子集已经成倍增长,并完成了只有人类才能完成的各种任务。像机器学习这样的技术可以执行管理任务、人脸识别、下棋,甚至翻译语言…

Java编译原理

代码Test.java public class Test {public static void main(String[] args) {int a 0xae;int b 0x10;int c a b;int d c 1;String s;s "hello";}} # javac Test.java # javap -c Test 参考:http://codemacro.com/2015/03/31/intro-java-bytecod…

RHEL5.5学习--安装vmtools

首先先说明两点: (1)vmtools的安装需要gcc的支持,所以首先确定gcc是否已经安装。可运行gcc -v,若能显示gcc版本信息则说明安装完成,否则请查看上一篇文章(RHEL5.5学习--查看gcc是否安装以及如何…

SQL server 专业词汇

sql组成:DDL:数据库模式定义语言,关键字:createDML:数据操纵语言,关键字:Insert、delete、updateDCL:数据库控制语言 ,关键字:grant、removeDQL:数…

只会高中数学运算就能发现算法?Google开源的AutoML-Zero有多厉害

译者 | 刘畅出品 | AI科技大本营(ID:rgznai100)机器学习研究,已经在多个方面都取得了进步,包括模型结构和优化方法等。而使此类研究自动化的工作(称为AutoML)也有重大进展。这一进展主要集中在神经网络的体…

Tsar安装使用

Tsar是淘宝开发的一个非常好用的系统监控工具,在淘宝内部大量使用,它不仅可以监控CPU、IO、内存、TCP等系统状态,也可以监控Apache,Nginx/Tengine,Squid等服务器状态。值得一提的是,Tsar 支持将数据存储到 …

《虚拟化与云计算》读书感(四)数据中心的设计和构造

任何大型系统的设计和构造都是一项复杂的过程,数据中心的的设计和构造也是一项系统的工程,需要人们相互协作来完成总体的设计、建筑和基础设施的构建,以及软硬件的采购和上线。几天我看的书中这一节主要是将如何总体设计和构造以及要做的工作…

C 的大致运行原理。

// 尽量多上干货。我是Xcode 运行环境。 // 这些简单的我就写的 少些 。 任何一个C语言程序都是由一个或者多个程序段(小程序)构成的,每个程序段都有自己的功能,我们一般称这些程序段为“函数”。 函数有 声明(定义) 和 使用&…

Spring AOP与IOC以及自定义注解

Spring AOP实现日志服务 pom.xml需要的jar <dependency><groupId>org.apache.commons</groupId><artifactId>commons-lang3</artifactId><version>3.4</version> </dependency> <dependency><groupId>org.spring…

小白也能看懂:一文学会入门推荐算法库 surprise

来源 | 机器学习与推荐系统surprise 支持的每个算法本身思路并不复杂&#xff0c;代码也不晦涩难懂&#xff0c;我们主要的目的是理解它的架构&#xff0c;学习框架各个部分的交互。这篇文章是想从一个整体的视角&#xff0c;以作者最初的思路为主线进行介绍&#xff0c;观察并…

开发人员必备网站

http://www.gotapi.com/语言&#xff1a;英语简介&#xff1a;HTML,CSS,XPATH,XSL,JAVASCRIPT等API的查询网站。http://www.w3schools.com/语言&#xff1a;英语简介&#xff1a;W3C制定的标准诸如XML,HTML,XSL等等的在线学习教程。http://www.xml.org.cn/语言&#xff1a;中文…

iOS实现依赖注入

依赖注入(Dependency Injection)这个词&#xff0c;源于java&#xff0c;但在Cocoa框架中也是十分常见的。举例来说&#xff1a;UIView的初始化方法initWithFrame - (id)initWithFrame:(CGRect)frame NS_DESIGNATED_INITIALIZER; 这里的frame传入值&#xff0c;就是所谓的依赖(…

shell语法以及监控进程不存在重启

转码 # dos2unix ./test.sh 权限 # chmod ax ./test.sh语法变量var"111"echo $varecho ${var}运算no14;no25;let resultno1no2echo $result;自增自减少let no let no--[]和let类似result$[ no1 no2 ]result$[ $no1 5 ]也可以使用(())&#xff0c;但使用(())时&…

当莎士比亚遇见Google Flax:教你用​字符级语言模型和归递神经网络写“莎士比亚”式句子...

作者 | Fabian Deuser译者 | 天道酬勤 责编 | Carol 出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;有些人生来伟大&#xff0c;有些人成就伟大&#xff0c;而另一些人则拥有伟大。—— 威廉莎士比亚《第十二夜》在几个月前&#xff0c;谷歌的研究人员介绍了机器学习…

netbackup错误之can not connect on socket(25)

rhel5.5上安装netbackup 7.0&#xff0c;这个版本只能安装在64位系统上。安装完netbackup 7.0后&#xff0c;发现登录界面一直报java认证失败&#xff0c;查看了下日志文件&#xff0c;报如下内容&#xff1a; 查了下系统设置&#xff0c;发现/etc/hosts文件里的主机名对应的IP…

支撑Spring的基础技术:泛型,反射,动态代理,cglib等

1.静态代码块和非静态代码块以及构造函数 出自尚学堂视频&#xff1a;《JVM核心机制 类加载全过程 JVM内存分析 反射机制核心原理 常量池理解》 public class Parent {static String name "hello";//非静态代码块{System.out.println("1");}//静态代码块…

深度干货!如何将深度学习训练性能提升数倍?

作者 | 车漾&#xff0c;阿里云高级技术专家顾荣&#xff0c;南京大学副研究员责编 | 唐小引头图 | CSDN 下载自东方 IC出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;近些年&#xff0c;以深度学习为代表的人工智能技术取得了飞速的发展&#xff0c;正落地应用于…

VIM变IDE

2019独角兽企业重金招聘Python工程师标准>>> 根据这篇博文写了个脚本&#xff0c;简单的解压插件和复制配置&#xff0c;可以帮大家快速配置一个VIM。 脚本中使用rpm安装ctags&#xff0c;所以只支持redhat系的&#xff0c;debian系的要自己安装ctags. 脚本放在gith…

Netbeans使用maven下载源码

如果需要研究源码&#xff0c;自然需要下载源码&#xff0c;其实Netbeans使用maven构建项目下载源码非常简单。 springmvc一开始没有下载源码 commons-lang3是下了源码的&#xff0c;下面是对其调用的代码 可以看到点开其代码是源码&#xff0c;也可以打断点 开一个调试 下载源…

讯飞智能语音先锋者:等到人机交互与人类交流一样自然时,真正的智能时代就来了...

作者 | 夕颜出品 | CSDN&#xff08;ID:CSDNnews&#xff09;「AI 技术生态论」 人物访谈栏目是 CSDN 发起的百万人学 AI 倡议下的重要组成部分。通过对 AI 生态顶级大咖、创业者、行业 KOL 的访谈&#xff0c;反映其对于行业的思考、未来趋势的判断、技术的实践&#xff0c;以…

今天看到两个题 写出来思考一下

数组中已有升序的6个数,输入一个数插入到数组中该数组仍然升序. 1&#xff0c;6&#xff0c;9&#xff0c;23&#xff0c;56&#xff0c;95 输入一个数 50 输出 1&#xff0c;6&#xff0c;9&#xff0c;23&#xff0c;56&#xff0c;50&#xff0c;95 题目二 输入一个…

android开发之动画的详解 整理资料 Android开发程序小冰整理

2019独角兽企业重金招聘Python工程师标准>>> /** * 作者&#xff1a;David Zheng on 2015/11/7 15:38 * * 网站&#xff1a;http://www.93sec.cc * * 微博&#xff1a;http://weibo.com/mcxiaobing * * 微博&#xff1a;http://weibo.com/93sec.cc */ 个人交流QQ9…

框架源码学习笔记

1.WebListener Servlet3.0提供WebListener注解将一个实现了特定监听器接口的类定义为监听器&#xff0c;这样我们在web应用中使用监听器时&#xff0c;也不再需要在web.xml文件中配置监听器的相关描述信息了。 Web应用启动时就会初始化这个监听器 WebListener public class M…

20万个法人、百万条银行账户信息,正在暗网兜售

导语&#xff1a;推特用户爆料&#xff0c;暗网上正在出售大量中国数个银行的账号信息&#xff0c;经记者调查&#xff0c;本次打包售价 3999 美金中包含 90 万条中国农业银行账号信息&#xff0c;另外一账号还宣称出售二十个数据包&#xff0c;其中包括百万条银行账号数据、12…

2010年9月blog汇总:敏捷个人和模型驱动开发

9月份指标产品开发开始同时进行两个客户的开发&#xff0c;所以考虑了客户化如何开发的问题&#xff1b;在企业定额产品上&#xff0c;参与清单综合单价库的产品架构并做了用户调研前期准备工作&#xff1b;再就是整理了一下模型驱动开发理论以及思考了OpenExpressApp的几个建模…

Tomcat的配置及优化

Tomcat 服务器是基于Apache 软件基金会项目开发的一个免费的开放源代码的Web 应用服务器它是开发和调试JSP 程序的首选&#xff0c;主要用在中小型系统和并发访问用户不是很多的场合&#xff0c;实际Tomcat 部分是Apache 服务器的扩展&#xff0c;但它是独立运行的&#xff0c;…

JAX-WS Web 服务开发调用和数据传输分析

一. 开发服务 新建maven的web项目就可以了&#xff0c; 1.新建一个web服务 2.服务名称定义 3.更改配置 4.默认建好的服务文件 5.增加一个add的服务 import javax.jws.WebService; import javax.jws.WebMethod; import javax.jws.WebParam;/**** author Administrator*/ WebSer…