当前位置: 首页 > 编程日记 > 正文

“含光”剑出,谁与争锋?阿里重磅发布首颗AI芯片含光800

作者 | 夕颜、胡巍巍

编辑 | 唐小引

出品 | AI 科技大本营(ID:rgznai100)

9 月末的杭州气温适宜,宜出游,宜在湖边餐厅浅酌一杯清茶消闲。但在钱塘江水支流河畔的云栖小镇,却完全一副与闲适氛围不相称的热闹景象。

因为今天阿里巴巴一年一度的云栖大会在这里正式开幕,早上 8 点钟不到,会场外早已人头攒动。杭州市人民政府副市长柯吉欣表示,今年云栖大会的参会嘉宾超过八万人。

进入主会场后,格子衬衫成了会前一道亮丽的风景线。

乐队激情开唱,为大会助阵。

开幕式和精彩的“前菜”过后,2019年云栖大会正式拉开帷幕,阿里巴巴集团首席技术官兼阿里云智能总裁、达摩院院长张建锋紧接着逍遥子之后发表了题为《构建数字经济基础设施》的演讲。

张建锋,花名行癫,2004 年加入淘宝,担任首席架构师,此后一直在淘宝工作,阿里巴巴集团合伙人之一。现任阿里巴巴集团首席技术官(CTO)兼任阿里云事业群首席技术官(CTO)、中台事业群总裁、集团技术战略执行小组组长,2018 年 11 月 26 日阿里组织架构调整之后,张建锋兼任阿里云智能事业群总裁,向阿里巴巴集团 CEO 张勇汇报。

以下为演讲亮点提炼:

平头哥出新!全球最高性能 AI 推理芯片含光800发布

会上,张建锋宣布了阿里巴巴平头哥重磅发布:AI 推理芯片含光 800,在 AI 场景中对异构计算做了补充。

             

“含光”一出,便在现场引起了热烈的掌声,张建锋介绍道,在业界标准的 ResNet-50测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3倍。

张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光 800 是平头哥的万里长征第一步,我们还有很长的路要走。”

含光其名,源自上古三大神剑之一「含光剑」,该剑含而不露,光而不耀,正如含光 800 带来的无形却强劲的算力。在杭州城市大脑的业务测试中,1 颗含光 800 的算力相当于 10 颗 GPU。

据阿里官方介绍,含光 800 性能的突破得益于软硬件的协同创新:硬件层面采用创新低自研芯片架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了 I/O 需求和数据的搬移,NPU 同时深度优化了卷积、矩阵乘、向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对 CNN 及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗 NPU 上完成计算。此外,它还拥有自动化开发工具,支持 TensorFlow、Caffe 等主流开源框架,还可进行多模型动态部署。

含光 800 已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要 40 颗传统GPU,延时为 300ms,使用含光 800 仅需 4 颗,延时降至 150 ms。拍立淘商品库每天新增 10 亿商品图片,使用传统 GPU 算力识别需要 1 小时,使用含光 800 后可缩减至 5 分钟。

此外,含光 800 将通过阿里云对外输出 AI 算力。基于含光 800 的 AI 云服务也在今天正式上线,相比传统 GPU 算力,性价比提升 100%,对于受限于算力瓶颈的企业而言,含光 800 可以更高效地运行更复杂、更先进的算法。

过去一年,平头哥团队在不断探索芯片与场景的融合,如对算力需求较大的图像视频分析、搜索、推荐等业务场景。围绕这一目标,平头哥针对场景深度定制了芯片的软硬件,例如自研了架构、软件编译器、框架、工具链等,如先后发布的玄铁 910、无剑 SoC 平台,后期也针对 INT8数据类型做了大量优化。

张建锋表示,端云一体芯片是平头哥的主要方向,终端玄铁处理器可以与云端含光 800芯片协同。

平头哥模式:端云一体芯片生态为各行业提供普惠算力

一年前,阿里宣布要自研芯片,短短一年时间之内,含光 800 即问世,且芯片的设计、流片整过程极短,据悉,平头哥团队 7 个月就完成了含光 800 的前端设计,之后仅用了 3 个月就成功流片。

出手快准狠,阿里平头哥做芯片的决心和能力都不容小觑。

和绝大多数芯片商不同的是,平头哥的目的并非卖芯片,而是开辟了全新的商业模式(平头哥模式),致力于为企业提供普惠算力。

随着含光 800 的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器IP、一站式芯片设计平台和 AI 芯片,实现了芯片设计链路的全覆盖。

平头哥团队表示,AIoT 场景需要新的计算架构,需要安全、在线和智能等新的特性,所有芯片面临升级,这必将在芯片行业将引起一波全新技术革命和产业浪潮。但 AIoT 市场有强应用驱动和场景碎片化等特点,芯片公司按照传统的方式设计芯片很难适应未来的需求,平头哥希望通过端云一体芯片生态为各行业提供普惠算力。

未来,平头哥的产品形态还会进一步完善,例如推出云上 AI 训练芯片和端上 AI 推理芯片,目前平头哥还在研发用于阿里云神龙服务器的 SoC 专用芯片,以满足更多场景的算力需求。

数字化经济四大关键技术

除了这一重磅发布之外,张建锋在演讲中还介绍了阿里巴巴在数字化建设中所做的工作和成果。

阿里巴巴的核心使命之一就是构建数字经济基础设施。张建锋说道,在数据大爆炸的时代,数据成为核心资源,数据相当于农业社会的石油,算力相当于工业时代的发电机。如今,数字经济发展迅速,全球数据呈增张趋势,若干年后将达到 175 ZB 的规模。数据显示,2018 年,数据对我国 GDP 增长的贡献率达 67.9%,连续 5 年贡献率超过 50%。没有数字化对经济的影响,相当于没有计算机对信息化的影响。

他认为,数字经济驱动着经济变革,全要素数字化升级成为数字经济发展的新动能,从需求到生产,从供应到消费,数据成为数字经济发展强有力的驱动力。

他还指出,现代信息技术在驱动数字化转型的进程中发挥着核心作用,是数字经济的基础。他将数字化经济需要的技术总结为四大关键点:可靠易用的云、全局智能的大数据、云端一体的智联网和随时随地的移动协同。

从去年开始,阿里云升级为阿里云智能,云第一次把 IT 技术从端到端的设施集成到云端,完成了一次变革,让企业和个人可从云端获得稳定、便捷、低成本、可靠的算力。

其中,可靠易用的云是数字经济的基础设施。对于企业来说,上云是一号位战略决策,一定要从技术理念变革和顶层设计层面推动。

另外,大数据深刻地改变了很多应用,张建锋认为,云与大数据之间有着紧密的联系。有了云,我们可以处理大规模的数据,但两者的结合才是构建数字化的基础。全局智能的大数据技术的全链路处理让数据产生价值,“让数据多跑路”可以让数据集中发挥最大效能,比如浙江省把 92 个部门数据打通之后向数据要智能,累积为 2000 万市民提供服务。

拥有云端一体的智联网在数字化过程中也十分关键。实现一切设备的在线化、实时化是阿里巴巴的目标,为用户提供云端组件、实时化产品和服务,这是智联网的核心。

随后,张建锋还以钉钉为例讲解了随时随地移动协同的重要性。他说道,目前钉钉上已有 1000万以上组织在该平台上实现了在线移动协同,移动化也从消费域进入生产域,移动协同成为数字化经济的一个核心基础设施。

含光 800 的发布使得阿里平头哥端云一体全栈产品系列初步成型,助力阿里在数字经济基础设施构建中“再下一城”。未来,阿里端云一体的芯片生态能在全球芯片技术升级和产业浪潮中走多远,我们拭目以待。

(*本文为AI科技大本营原创文章,转载请微信联系1092722531)

精彩推荐

2019 中国大数据技术大会(BDTC)历经十一载,再度火热来袭!豪华主席阵容及百位技术专家齐聚,15 场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读,深入解析热门技术在行业中的实践落地。【早鸟票】与【特惠学生票】限时抢购,扫码了解详情!

相关文章:

c++面试题中经常被面试官面试的小问题总结(一)(本篇偏向基础知识)

原文作者:aircraft 原文链接:https://www.cnblogs.com/DOMLX/p/10711810.html 1.类中的函数定义后加了一个const代表什么? 代表它将具备以下三个性质:1.const对象只能调用const成员函数。2.const对象的值不能被修改,在…

矩阵特征分解介绍及雅克比(Jacobi)方法实现特征值和特征向量的求解(C++/OpenCV/Eigen)

对角矩阵(diagonal matrix):只在主对角线上含有非零元素,其它位置都是零,对角线上的元素可以为0或其它值。形式上,矩阵D是对角矩阵,当且仅当对于所有的i≠j, Di,j 0. 单位矩阵就是对角矩阵,对角元素全部是1…

Entity Framework CodeFirst数据迁移

原文:Entity Framework CodeFirst数据迁移前言 紧接着前面一篇博文Entity Framework CodeFirst尝试。 我们知道无论是“Database First”还是“Model First”当模型发生改变了都可以通过Visual Studio设计视图进行更新,那么对于Code First如何更新已有的模型呢&…

限时早鸟票 | 2019 中国大数据技术大会(BDTC)超豪华盛宴抢先看!

2019 年12月5-7 日,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN、中科天玑数据科技股份有限公司协办的 2019 中国大数据技术大会,将于北京长城饭店隆重举行。届时,超过百位技术专家及行业领袖将齐聚于此&…

Google AI 系统 DeepMind无法通过 高中数学

Google 旗下 DeepMind 团队让 AI 系统接受一项高中程度的数学测试,结果在 40 道题目中只答对了 14 题,甚至连「1111111」也算错了。说来难以置信,Google AI 系统能打败人类世界棋王,却无法通过高中程度的数学考试。上周&#xff0…

C++11中std::tuple的使用

std::tuple是类似pair的模板。每个pair的成员类型都不相同,但每个pair都恰好有两个成员。不同std::tuple类型的成员类型也不相同,但一个std::tuple可以有任意数量的成员。每个确定的std::tuple类型的成员数目是固定的,但一个std::tuple类型的…

PHP Countable接口

实现该接口可以使用count()方法来获取集合的总数转载于:https://www.cnblogs.com/xiaodo0/p/3611307.html

矩阵奇异值分解简介及C++/OpenCV/Eigen的三种实现

奇异值分解(singular value decomposition, SVD):将矩阵分解为奇异向量(singular vector)和奇异值(singular value)。通过奇异值分解,我们会得到一些与特征分解相同类型的信息。然而,奇异值分解有更广泛的应用。每个实数矩阵都有一个奇异值分…

经典!工业界深度推荐系统与CTR预估必读的论文汇总

(图片付费下载自视觉中国)来源 | 深度传送门(ID: gh_5faae7b50fc5)导读:本文是“深度推荐系统”专栏的第十一篇文章,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变…

docker上传自己的镜像

https://blog.csdn.net/boonya/article/details/74906927 需要注意的就是命名规范 docker push 注册用户名/镜像名 tag命令修改为规范的镜像: docker tag boonya/tomcat-allow-remote boonyadocker/tomcat-allow-remote转载于:https://www.cnblogs.com/MC-Curry/p/1…

多个class相同的input标签 获取当前值!方法!

2019独角兽企业重金招聘Python工程师标准>>> var a $(this).prev( ".你的class" ).val(); 转载于:https://my.oschina.net/u/1169079/blog/210082

C++11中std::forward_list单向链表的使用

std::forward_list是在C11中引入的单向链表或叫正向列表。forward_list具有插入、删除表项速度快、消耗内存空间少的特点,但只能向前遍历。与其它序列容器(array、vector、deque)相比,forward_list在容器内任意位置的成员的插入、提取(extracting)、移动…

即学即用的30段Python实用代码

(图片付费下载自视觉中国)原标题 | 30 Helpful Python Snippets That You Can Learn in 30 Seconds or Less作 者 | Fatos Morina翻 译 | Pita & AI开发者Python是目前最流行的语言之一,它在数据科学、机器学习、web开发、脚本编写、自…

如何配置IntelliJ IDEA发布JavaEE项目?

一、以war的形式运行项目 步骤1 新建或者导入项目后,选择File菜单-》Project Structure...,如下图: 步骤2 配置项目类型,名字可以自定义: 说明:这里的Artifact如果没有配置好的话,配置Tomcat时没…

网络分布式软件bonic清除

近期,有一款网格计算软件,在很多服务器上进行了部署,利用cpu进行运算。虽然未构成安全隐患,但是比较消耗资源,影响设备正常运行。今天对设备彻底检查,发现了一个分布式计算软件boinc,他是利用网…

C++/C++11中std::list双向链表的使用

std::list是双向链表,是一个允许在序列中任何一处位置以常量耗时插入或删除元素且可以双向迭代的顺序容器。std::list中的每个元素保存了定位前一个元素及后一个元素的信息,允许在任何一处位置以常量耗时进行插入或删除操作,但不能进行直接随…

React组件设计之边界划分原则

简述 结合SOLID中的单一职责原则来进行组件的设计 Do one thing and do it well javaScript作为一个弱类型并在函数式和面对对象的领域里疯狂试探语言。SOLID原则可能与其他语言例如(java)的表现可能是不同的。不过作为软件开发领域通用的原则&#xff0…

阿里AI labs发布两大天猫精灵新品,将与平头哥共同定制智能语音芯片

作者 | 夕颜出品 | AI科技大本营(ID:rgznai100)2019 年,去年刮起的一阵智能音箱热浪似乎稍微冷却下来,新产品不再像雨后春笋一样层出不穷,挺过市场洗礼的产品更是凤毛麟角,这些产品的性能、技术支持和体验基…

js 中文匹配正则

为什么80%的码农都做不了架构师?>>> /^[\u4e00-\u9fa5]{2,4}$/gi.test() 匹配中文正则 转载于:https://my.oschina.net/fedde/blog/211852

Caffe中对cifar10执行train操作

参考Caffe source中examples/cifar10目录下内容。cifar10是一个用于普通物体识别的数据集,cifar10被分为10类,分别为airplane、automobile、bird、cat、deer、dog、frog、horse、ship、truck,关于cifar10的详细介绍可以参考: http://blog.csd…

解决掉这些痛点和难点,让知识图谱不再是“噱头”

(图片付费下载自视觉中国)作者| 夕颜出品| AI科技大本营(ID:rgznai100)2012 年,谷歌正式提出知识图谱的概念,当时,研究人员的主要目的是用来优化搜索引擎技术。今年初,谷歌前员工&am…

mongodb使用常用语法,持续更新

设置快捷命令D:\mongodb4.0.8\bin>mongod --config "D:\mongodb4.0.8\mongo.conf" --auth --install --serviceName "MongoDB"mongodb配置文件#数据库路径dbpathD:\mongodb4.0.8\data\db#日志输出文件路径logpathD:\mongodb4.0.8\data\log\MongoDB.log#…

Android之NDK开发的简单实例

NDK全称为Native Development Kit,是本地开发工具集。在Android开发中,有时为了能更好的重用以前的C/C的代码,需要将这些代码编译成相应的so,然后通地JNI以供上层JAVA调用。当然,也有的是为了更高的保护性和安全性。下…

阿里披露AI完整布局,飞天AI平台首次亮相

作者 | 夕颜编辑 | 唐小引出品 | AI 科技大本营(ID:rgznai100)9 月 26 日上午,在云栖大会阿里云飞天智能主论坛上,年轻的阿里巴巴副总裁、阿里云智能计算平台事业部总经理、高级研究员贾扬清与其在 Facebook 的老同事—— Faceboo…

使用Caffe基于cifar10进行物体识别

在http://blog.csdn.net/fengbingchun/article/details/72953284中对cifar10进行train,这里通过train得到的model,对图像进行识别。cifar10数据集共包括10类,按照0到9的顺序依次为airplane(飞机)、automobile(轿车)、bird(鸟)、cat(猫)、deer…

SoJpt Boot 2.3-3.8 发布,Spring Boot 使用 Jfinal 特性极速开发

SoJpt Boot 2.3-3.8 发布了。SoJpt Boot 基于 JFinal 与 Spring Boot制作, 实现了 Spring Boot 与 Jfinal 的混合双打,使 Spring Boot 下的开发者能够体验 Jfinal 的极速开发特性。新版更新内容如下: SoJpt-Boot-2.3-3.8 changelog 1、加入事务注解,Tx(value"c…

PL/SQL程序设计 第七章 包的创建和应用

7.1 引言包是一组相关过程、函数、变量、常量和游标等PL/SQL程序设计元素的组合,它具有面向对象程序设计语言的特点,是对这些PL/SQL 程序设计元素的封装。包类似于C和JAVA语言中的类,其中变量相当于类中的成员变量,过程和函数相当…

C++11中头文件chrono的使用

在C11中&#xff0c;<chrono>是标准模板库中与时间有关的头文件。该头文件中所有函数与类模板均定义在std::chrono命名空间中。 std::chrono是在C11中引入的&#xff0c;是一个模板库&#xff0c;用来处理时间和日期的Time library。要使用chrono库&#xff0c;需要incl…

为什么平头哥做芯片如此迅猛?

作者 | 胡巍巍 发自杭州云栖大会责编 | 唐小引来源 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;2018年10月31日&#xff0c;阿里旗下的平头哥半导体有限公司成立。如今&#xff0c;平头哥成立不到一年&#xff0c;就已成绩斐然。2019年9月25日&#xff0c;阿里巴巴旗…

Vue 组件库 heyui@1.18.0 发布,新增地址选择、图片预览组件

开发四年只会写业务代码&#xff0c;分布式高并发都不会还做程序员&#xff1f; 新增 CategoryPicker 新增组件 CategoryPicker&#xff0c;地址级联组件的最佳方案。 <CategoryPicker :option"option" v-model"value"/> 相关文档 ImagePreview 新…