阿里飞天大数据飞天AI平台“双生”系统正式发布,9大全新数据产品集中亮相
作者 | 夕颜
责编 | 唐小引
出品 | AI科技大本营(ID:rgznai100)
如今,大数据和 AI 已经成为两个分不开的词汇,没有大数据,AI 就失去了根基;没有 AI,数据不会呈现爆发式的增长。如何将 AI 与大数据有机结合,成为很多企业的目标和方向。
阿里巴巴也在进行着这样的尝试。幸运的是,现在,他们已经实现了这个目标。
9 月 26 日,在杭州云栖小镇举行的云栖大会大数据&AI 峰会上,阿里云智能计算平台事业部资深产品专家李京梅正式发布向公众发布了飞天大数据平台和飞天 AI 平台。
飞天大数据与飞天AI平台“双生”系统
李京梅把这两者比喻为一对孪生兄弟,同出同进,相互使能,形成密不可分的有机结合关系。在大数据与AI形成的双生系统中,大数据平台为 AI 提供数据和算力,AI 反过来优化大数据系统,让大数据可以“自动驾驶”,做到智能优化,AI 加持的大数据计算能力大大提升。
作为飞天 AI 平台的核心,机器学习平台 PAI 在这张图中处于中间的位置。李京梅说道,人工智能发展有三要素,包括数据、算法和算力,同样的算法,放到十年前,由于没有大数据上的天时地利,这些算法可能不会产生和今天同等的价值。所以,大数据平台和AI 平台之间互相使能在于大数据为机器学习的平台创造了海量的数据,让 AI 产生更多能力,而当 AI 落地后,行业系统和业务系统又产生更多、更丰富的数据,产生一个数据生产的闭环,大数据和 AI 并行,会创造更多的价值。
她介绍道,阿里巴巴飞天大数据平台具备数据综合治理、数据构建、数据交换等能力,赋能机器学习 PAI 平台,完成统一的调度和编排。它还可以对接各种大数据计算引擎,进行统计交互式分析和云计算技术业务。
在此之前,阿里云智能计算平台事业部研究员关涛和阿里云智能计算平台事业部资深技术专家徐晟还介绍了飞天大数据平台和飞天AI平台的发展历程,并揭秘了一部分飞天大数据平台技术。
关涛表示,从 2009 年开始研发开始,飞天大数据平台经历了两个阶段的发展。
第一阶段:2009 年-2015 年,这一时期,团队更多关注的是平台的稳定性、易用性和可用性,到 2009 年发布“登月”项目,阿里的所有数据都集中到这一平台,阿里的中台也建设起来;
第二阶段:2015 年之后,随着大数据爆炸时代的到来和深度学习的发展,数据处理能力成为制约 AI 发展的瓶颈,数百 PB 级的数据处理问题、激增的数据处理复杂度成为摆在 CIO/CTO 面前的现实问题。
面对体量问题,阿里通过高效的算子层与存储层的优化,寻找“最优”的执行计划(算子组合),动态查询计划,灵活的算子组合,动态调整与自学习调优,从引擎优化带自学习调优,基于历史信息恶自学习回归优化,全面自适应优化几个方面持续升级了自己的计算力,并使得性能提升前提下存储成本降低 30%,计算新规格上线后成本降低 70%。
徐晟表示,大数据平台升级为飞天大数据平台,很大部分来自于广大企业用户在业务快速发展时期产生的数据治理需求,众所周知,数据是企业的生产力,创新的企业在快速发展过程中,会选择更加灵活、适配自身业务的数据存储与计算,当企业的业务已经铺遍全国,一定会存在存储跟着数据走、数据跟着业务走的局面(即数据分布在各个区域的数据平台上),传统的大数据解决方案,是帮助企业汇聚统一的大数据平台,所有数据存储在一起,计算在一起,而飞天大数据平台可以让客户实现跨存储数据计算、跨地区数据分析、跨云数据使用,让客户的数据技术紧跟业务的发展,让客户实现个性化搭建大数据平台。
多个大数据新品发布
紧接着,李京梅进行了几项全新产品发布,以下为新品盘点和亮点提炼:
DataWorks V3.0
DataWorks V3.0 的定位是一个云原生企业级智能大数据平台,为用户提供技术工具和平台,新特性包括全面支持开源大数据生态,实现管理、任务调度和质量监控等;混合调度能力升级,实现跨引擎、跨区域、跨云调度;多引擎开发平台,可对接多个引擎,并支持自定义引擎;AI 算法能力,结合 AI 和大数据能力;全新升级的数据综合治理能力。
机器学习平台 PAI
PAI 是飞天 AI 平台下最核心的产品。它的核心功能是让训练更容易,不懂算法背景也可以通过拖拉拽动作对图片进行分类;在 AI 市场中,让算法模型交易更容易;支持算法自定义上传,与开源生态对接更容易。
MaxCompute V3.0 大数据智能云数仓
今天,我们进行入了一个智能化数仓时代,MaxCompute 也经历了十年左右的发展,它一方面使得数据量和成本的线性关系得到优化,并为用户带来两点好处,一是可以直接享受计算存储,成本降低 70%,第二是降低上云的成本,缩减上游周期。
E-MapREduce V4.0
E-MapReduce 是阿里的云原生开源大数据平台,V4.0 为轻量级敏捷版,小微服务缩减到 9 台服务器,适配 ECS,可为企业节省成本。
实时计算云原生版本
实时计算云原生版本由 Ververica 提供支持,支持开源 Flink 1.6 至 1.9 版本,具有开箱即用的特点,提供多个可插拔增值服务,且产品基础版本可免费使用。
新一代实时交互时分析
可实现 MaxCompute 加速,快速构建实时仓库、联邦查询功能。
Elasticsearch V2.0
图计算引擎+开发套件
性能领先业界 1-3 个数量级,索引构建可实现秒级弹性扩缩容,支持 50 多种场景,最高支持百亿节点、1000亿边、30 TB规模的图计算,建模与查询简单直观,并包含一套针对图计算的开发套件。
开放搜索 OpenSearch V2.0
适用用户精准画像,提升搜索带来的业务价值,包括查询语义理解,机器学习排序算法、专业搜索效果迭代工具。
把飞天大数据平台和飞天 AI 平台“打包”,放在一起在阿里最重要的会议之一上一起亮相,阿里自有深意。随着 9 大全新数据产品的发布,阿里对自身的数据能力做了一次集中展示。这波操作你觉得稳不稳?欢迎留言讨论。AI 科技大本营将继续在云栖大会前线带来最新报道,敬请关注~
(*本文为 AI科技大本营原创文章,转载请微信联系作者 1092722531)
相关文章:

关于JavaScript的闭包(closure)
(转载自阮一峰博客) 闭包(closure)是Javascript语言的一个难点,也是它的特色,更是函数式编程的重要思想之一,很多高级应用都要依靠闭包实现。 下面就是我的学习笔记,对于Javascript初…

Vagrant控制管理器——“Hobo”
Hobo是控制Vagrant盒子和在Mac上编辑Vagrantfiles的最佳和最简单的方法。您可以快速启动,停止和重新加载您的Vagrant机器。您可以从头开始轻松创建新的Vagrantfile。点击进入,尽享Hobo for Mac全部功能! Hobo做什么? 启动…

微众银行AI团队开源联邦学习框架,并发布《联邦学习白皮书1.0》
(图片由AI科技大本营付费下载自视觉中国)编辑 | Jane来源 | 《联邦学习白皮书1.0》出品 | AI科技大本营(ID:rgznai100)【导语】2019年,联邦学习成为业界技术研究与应用的焦点。近日,微众银行 AI 项目组编制…

C++11中头文件atomic的使用
原子库为细粒度的原子操作提供组件,允许无锁并发编程。涉及同一对象的每个原子操作,相对于任何其他原子操作是不可分的。原子对象不具有数据竞争(data race)。原子类型对象的主要特点就是从不同线程访问不会导致数据竞争。因此从不同线程访问某个原子对象…

Oracle回收站
回收站是删除对象使用的存储空间。可以使用实例参数recyclebin禁用回收站,默认是on,可以为某个会话或系统设置为off或on。所有模式都有一个回收站。 当表空间不足时可以自动重用回收站对象占用的表空间(此后不可能恢复对象)&#…
协方差矩阵介绍及C++/OpenCV/Eigen的三种实现
函数f(x)关于某分布P(x)的期望(expectation)或者期望值(expected value)是指,当x由P产生,f作用于x时,f(x)的平均值。对于离散型随机变量,这可以通过求和得到:对于连续型随机变量可以通过求积分得到:当概率分…

10分钟搭建你的第一个图像识别模型 | 附完整代码
(图片由AI科技大本营付费下载自视觉中国)作者 | Pulkit Sharma译者 | 王威力来源 | 数据派THU(ID:DatapiTHU)【导读】本文介绍了图像识别的深度学习模型的建立过程,通过陈述实际比赛的问题、介绍模型框架和…

Rancher 2.2.2 发布,优化 Kubernetes 集群运维
开发四年只会写业务代码,分布式高并发都不会还做程序员? >>> Rancher 2.2.2 发布了。Rancher 是一个开源的企业级 Kubernetes 平台,可以管理所有云上、所有发行版、所有 Kubernetes集群,解决了生产环境中企业用户可能面…

EXP/EXPDP, IMP/IMPDP应用
2019独角兽企业重金招聘Python工程师标准>>> EXP/EXPDP, IMP/IMPDP应用 exp name/pwddbname filefilename.dmp tablestablename rowsy indexesn triggersn grantsn $ sqlplus username/passwordhostname:port/SERVICENAME OR $ sqlplus username Enter password:…

微软语音AI技术与微软听听文档小程序实践 | AI ProCon 2019
演讲嘉宾 | 赵晟、张鹏整理 | 伍杏玲来源 | CSDN(ID:CSDNnews)【导语】9 月 7 日,在CSDN主办的「AI ProCon 2019」上,微软(亚洲)互联网工程院人工智能语音团队首席研发总监赵晟、微软࿰…

C++11中std::condition_variable的使用
<condition_variable>是C标准程序库中的一个头文件,定义了C11标准中的一些用于并发编程时表示条件变量的类与方法等。条件变量是并发程序设计中的一种控制结构。多个线程访问一个共享资源(或称临界区)时,不但需要用互斥锁实现独享访问以避免并发错…

docker基础文档(链接,下载,安装)
一、docker相关链接1.docker中国区官网(包含部分中文文档,下载安装包,镜像加速器):https://www.docker-cn.com/2.docker官方镜像仓库:https://cloud.docker.com/3.docker下载:https://www.docker-cn.com/community-edi…

一个JS对话框,可以显示其它页面,
还不能自适应大小 garyBox.js // JavaScript Document// gary 2014-3-27// 加了 px 在google浏览器没加这个发现设置width 和height没有用 //gary 2014-3-27 //实在不会用那些JS框架,自己弄个,我只是想要个可以加载其它页面的对话框而以,这里用了别人的…

只需4秒,这个算法就能鉴别你的LV是真是假
(图片付费下载自视觉中国)导语:假冒奢侈品制造这个屡禁不止的灰色产业,每年给正品商家和消费者造成上千亿的损失,对企业和消费者造成伤害。作为全球奢侈品巨头,LVMH 对假冒奢侈品的打击十分重视。LVMH 其旗…
概率论中伯努利分布(bernoulli distribution)介绍及C++11中std::bernoulli_distribution的使用
Bernoulli分布(Bernoulli distribution):是单个二值随机变量的分布。它由单个参数∈[0,1],给出了随机变量等于1的概率。它具有如下的一些性质:P(x1) P(x0)1-P(xx) x(1-)1-xEx[x] Varx(x) (1-)伯努力分布(Bernoulli distribution,又…

关于View测量中的onMeasure函数
在自定义View中我们通常会重写onMeasure,下面来说说这个onMeasure有什么作用 onMeasure主要用于对于View绘制时进行测量 Override protected void onMeasure(int widthMeasureSpec, int heightMeasureSpec) {super.onMeasure(widthMeasureSpec, heightMeasureSpec);…

zabbix二次开发之从mysql取值在运维平台js图表展现
前沿:集群控制平台已经要慢慢的灰度上线了,出问题的时候,才找点bug,时间有点空闲。正好看了下zabbix的数据库,产生了自己想做一套能更好的展现zabbix的页面。更多内容请到我的个人的博客站点,blog.xiaorui.…
概率论中高斯分布(正态分布)介绍及C++11中std::normal_distribution的使用
高斯分布:最常用的分布是正态分布(normal distribution),也称为高斯分布(Gaussian distribution):正态分布N(x;μ,σ2)呈现经典的”钟形曲线”的形状,其中中心峰的x坐标由μ给出,峰的宽度受σ控制。正态分布由两个参数…

AI落地遭“卡脖子”困境:为什么说联邦学习是解决良方?
作者 | Just出品 | AI科技大本营(ID:rgznai100)毋庸置疑,在业界对人工智能(AI)应用落地备受期待的时期,数据这一重要支点却越来越成为一个“卡脖子”的难题。AI落地需要数据来优化模型效果,但大…

Linux下截取指定时间段日志并输出到指定文件
sed -n /2019-04-22 16:10:/,/2019-04-22 16:20:/p log.log > bbb.txt 转载于:https://www.cnblogs.com/mrwuzs/p/10752037.html

nginx+keepalive主从双机热备+自动切换解决方案
环境采集cenots 6.3 64位迷你安装,因为安装前,你需要做一些工作yum install -y make wget如果你愿意可以更新下系统,更换下yum源.1.安装keepalive官方最新版 keepalived-1.2.7tar zxvf keepalived-1.2.7.tar.gzcd keepalived-1.2.7在此之前。…
概率论中指数分布介绍及C++11中std::exponential_distribution的使用
指数分布:在深度学习中,我们经常会需要一个在x0点处取得边界点(sharp point)的分布。为了实现这一目的,我们可以使用指数分布(exponential distribution): p(x;λ) λlx≥0exp(-λx)指数分布使用指示函数(indicator function) lx≥…
肖仰华:知识图谱构建的三要素、三原则和九大策略 | AI ProCon 2019
演讲嘉宾 | 肖仰华(复旦大学教授、博士生导师,知识工场实验室负责人) 编辑 | Jane 出品 | AI科技大本营(ID:rgznai100) 近两年,知识图谱技术得到了各行各业的关注,无论是企业公司还…

Docker mongo副本集环境搭建
1、MongoDB Docker 镜像安装 docker pull mongo 2、Docker容器创建 MongoDB Docker 容器创建有以下几个问题: 1- MongoDB 容器基本创建方法和数据目录挂载 2- MongoDB 容器的数据迁移 3- MongoDB 设置登录权限问题docker run -p 27017:27017 -v <LocalDirectoryP…

菜鸟学习HTML5+CSS3(一)
主要内容: 1.新的文档类型声明(DTD) 2.新增的HTML5标签 3.删除的HTML标签 4.重新定义的HTML标签 一、新的文档类型声明(DTD) HTML 5的DTD声明为:<!doctype html>、<!DOCTYPE html>、<!DOCTY…
激活函数之logistic sigmoid函数介绍及C++实现
logistic sigmoid函数:logistic sigmoid函数通常用来产生Bernoulli分布中的参数,因为它的范围是(0,1),处在的有效取值范围内。logisitic sigmoid函数在变量取绝对值非常大的正值或负值时会出现饱和(saturate)现象,意味着函数会变得…

NLP重要模型详解,换个方式学(内附资源)
(图片有AI科技大本营付费下载自视觉中国)作者 | Jaime Zornoza,马德里技术大学译者 | 陈之炎校对 | 王威力编辑 | 黄继彦来源 | 数据派THU(ID:DatapiTHU)【导语】本文带你以前所未有的方式了解深度学习神经…

大闸蟹的OO第二单元总结
OO的第二单元是讲多线程的协作与控制,三次作业分别为FAFS电梯,ALS电梯和三部需要协作的电梯。三次作业由浅入深,让我们逐渐理解多线程的工作原理和运行状况。 第一次作业: 第一次作业是傻瓜电梯,也就是完全不需要考虑捎…

构建ASP.NET MVC4+EF5+EasyUI+Unity2.x注入的后台管理系统(31)-MVC使用RDL报表
原文:构建ASP.NET MVC4EF5EasyUIUnity2.x注入的后台管理系统(31)-MVC使用RDL报表这次我们来演示MVC3怎么显示RDL报表,坑爹的微软把MVC升级到5都木有良好的支持报表,让MVC在某些领域趋于短板 我们只能通过一些方式来使用rdl报表。 Razor视图不支持asp.net…

18段代码带你玩转18个机器学习必备交互工具
(图片有AI科技大本营付费下载自视觉中国)作者 | 曼纽尔阿米纳特吉(Manuel Amunategui)、迈赫迪洛佩伊(Mehdi Roopaei)来源 | 大数据(ID:hzdashuju)【导读】本文简要介绍将…