英伟达 400 亿美元收购 ARM 受阻,不妨考虑 VMware?
作者 | 马超
出品 | CSDN(ID:CSDNnews)
目前半导体行业的发展可以用冰火两重天来形容,传统的桌面及移动SOC(System on a Chip,系统级芯片)市场已经基本停止增长,而云计算成了各大巨头的兵家必争之地。
在行业整体突飞猛进的基础上,技术之魂帕特·基辛格从VMware回归后,英特尔便开始了史无前例的颠覆式革新,最近他们展示的全新一代计算结构Alder Lake,为x86的未来创新带来了全新的性能分配方案,也让英特尔彻底摘掉了“牙膏厂”的帽子。
另外一家半导体公司英伟达,在今年新品发布会上,也如期拿出了首款CPU芯片Grace,剑指AI云,不过英伟达早于去年欲收购ARM的计划如今受阻,一定程度上也影响了其在云计算领域的脚步。
个人认为英伟达应该对于帕特·基辛格的老东家VMware给予更多的关注,一旦他们用400亿美元收购ARM的交易被监管机构叫停,此时如果能将VMware收入囊中也很可能帮助他们在云数据中心方面变得更强。
毕竟放眼英特尔与英伟达的双“英”大战中,先搞定虚拟化平台的一方将获得极大的竞争优势。
Alder Lake vs. Grace,巨头也能起舞
在竞争中,新品的诞生明显都从竞品身上得到了很多有益的灵感,比如Alder Lake本次最大的升级就是引入了能效核与性能核的设计,虽然能效核与性能核这个概念听起来比较陌生,但从本质上看这个概念与ARM的big.LITTLE大小核架构没有什么大的差别,设计思路都是让小核去处理那些对算力要求比较低的问题,大核则专注于处理计算密集型的任务。
不过大小核技术在移动SOC的应用非常容易实现,在手机熄屏待机时用小核工作,而当用户进行游戏或者观看视频时则启动大核,两核中核心各负责一摊,界限分明井水不犯河水,应用效果很好。
但是大小核技术之前一直被认为不适合于云计算场景。由于绝大部分云场景都依赖于SIMD单指令多数据的硬件加速技术,而一般来说传统的小核都不支持AVX512等SIMD指令集,这也让大核在云计算的应用中几乎要全程待命,没有时间休息,所以英特尔在Alder Lake之前一般使用睿频技术也就是通过调节主频来进行能耗的优化。
但这次不一样了,英特尔对小核的优化简直令人瞠目结舌,Alder Lake的小核拥有5000个条目的分支目标缓存区,实现更准确的分支预测;并将指令缓存扩充到64K;簇乱序执行解码器,可在保持能效的同时,每周期解码多达6条指令,直接支持了AVX指令集,并且还能在性能保持一样的情况下,将能耗控制在前代的40%,这样也就让小核几乎可以应对绝大多数云场景,只有少量计算密度极大的场景下才需要大核下场参与,做到这么极致的程度引入大小核的设计完全没问题。
由于Grace和M1都是基于ARM架构的处理器,我们明显能从英伟达的Grace身上看到苹果M1的影子,由于ARM属于RISC精简指令集阵营,指令都是定长的,这使得ARM处理器在指令解码等方面天然比x86更具优势,x86的处理器做到6路解码基本就已经到了能耗极限,但是ARM处理器则可以轻松达到这一目标。根据黄仁勋在大会上的介绍,Grace最大的创新点在于把CPU与GPU之间的通信速度提升了近10倍,“这是一万名工程人员历经几年的研发成果,旨在满足当前世界最先进应用程序的计算需求,其具备的计算性能和吞吐速率是以往任何架构所无法比拟的。”
类似于DMA控制器在磁盘与内存之间搭建了一条快速通道一样,Grace体系中GPU核心与CPU核心之间的通信不需要CPU的调度,也不需要占用数据总线的带宽,之前CPU必须将数据从其内存的区域复制到GPU使用的区域,而在Grace的加持下,CPU只需要告诉GPU在内存的某位置有30MB的向量数据,然后就可以去做其它事了,GPU则可以通过Grace复制通道迅速开始计算任务。
这方面的威力我们可以从苹果的正确示范中得到启示,在苹果M1中显卡与内存加在一起只有16G,对比上一代MAC PRO内存128G,光是显存都有16G,不过搭载M1的入门版MAC在进行图像处理等需要CPU与GPU进行协同的运算任务时,至少比上一代顶配的MAC性能高出近一倍。其中的秘决就是将内存与显卡进行统一管理,从而大大提高了CPU与GPU的通信效率,因此英伟达的技术路线肯定也是非常有道理的。
但是这种颠覆式的革新,背后也有隐忧,想在云计算的领域立足恐怕还有很长的路要走。
想腾云,虚拟化是必须迈过去的坎
无论是Grace还是Alder Lake想在云计算领域有所作为都必须要迈过虚拟化的坎,比如Grace打通内存、显存的方案,在云计算这种多租户共存的场景下困难很多,在内存、缓存共享的方案下,CPU和GPU必须轮流访问主存储器,这就意味着他们要争夺数据总线的使用权,那么不同租户之间的界限如何划分就成了一个很值得讨论的问题。
在实践中单独一个GPU按照不同租户划分虚拟化能力的方案,都还不完全成熟,而如何将Grace这样的CPU与GPU的融合计算处理器进行虚拟化更不会是一个容易解答的问题。
Alder Lake大小核也是同样的问题,假如用户购买了一台1核的云主机,那么到底买的是大核还是小核呢?如果是大小核的综合体那么如何进行调度呢?为了解决调度难题,Intel在Alder Lake处理器中引入了Thread Director技术,Alder Lake处理器中集成了一个专用的MCU,用来监控当前处理器内核的运行情况,能够监测到每个线程的特征,比如它运行什么样的指令集、它的性能需求如何等等。
在收集完信息之后,它会将收集到的信息反馈给操作系统,而操作将会把这些信息与自己线程调度器相结合,判断是否应该将线程转移到别的核心上。如果与操作系统结合的好,那么一轮信息采集工作仅需要30微秒就能完成,而传统的调度器可能需要100多毫秒才能判断出结论,不过明显可以看到这是一项需要与操作系统进行深度结合的技术,没有软件方面支持,Thread Director发挥不出来效果。从目前的情况看Thread Director已经与Windows 11进行了结合优化,但是在云服务器领域Windows的份额几乎可以忽略不计,而Thread Director如何与虚拟化平台结合以实现资源的隔离,我目前还没有看到任何有关的动作。
对于打造软、硬结合IT生态的重要性,英伟达和英特尔都有很深刻的认识,比如英伟达还与Grace同时发布了Transformers框架Megatron、合成模型Omniverse、药物研发加速库Clara Discovery模型等软件产品,这些技术与英伟达的CUDA联合使用效果是非常好的,当然可能也是因为英伟达的产品全线都太香了,后来还引发了一个真假老黄的史诗级乌龙。
英特尔这次也适时推出了oneAPI的整合框架,基于oneAPI开发软件,无需考虑是CPU还是GPU还是TPU的问题,oneAPI会自动让你的代码在最适合的设备上运行。
但是在云计算虚拟化软件的生态方面VMware是当之无愧的王者,他们的ESXi/vSphere技术栈在管理的虚拟化CPU和GPU融合计算平台方面,与英特尔和英伟达都有着巨大的互补性。在云计算领域中“数千万台”服务器将在云端或者边缘运行人工智能,并将通过GPU加速,这是一个上百亿美元的巨大市场,而VMware以其特有虚拟化软件优势,能否成为巨头们下一个竞相收购的对象值得我们观察。
作者:马超,CSDN博客专家,阿里云MVP、华为云MVP,华为2020年技术社区开发者之星。
往
期
回
顾
阿里
百度大脑 OCR 技术加持白描 App
技术
一文全览机器学习建模流程
技术
使用 Mask-RCNN 的停车位检测
波士顿动力机器人解锁跑酷技能
分享
点收藏
点点赞
点在看
相关文章:

单目和双目模式识别---游戏控制
http://v.youku.com/v_show/id_XMzQwMjUwNTY.html http://blog.csdn.net/anthonywanted/article/details/3024535转载于:https://www.cnblogs.com/pengkunfan/p/4220144.html

vsftpd企业应用快速部署文档
系统环境:centos 5.6 vsftpd:2.3.5 vsftpd是UNIX/Linux中非常安全且快速的FTP服务器,目前已经被许多大型站点所采用。vsftpd支持将用户名和口令保存在数据库文件或数据库服务器中。登录FTP有三种方式,匿名登录、本地用户登录和虚拟…

华为持续引领,开辟5G Massive MIMO绿色新赛道
今日,在华为举办的无线首届媒体沙龙暨MBBF2021预沟通会上,华为无线产品线首席营销官甘斌发表了“华为持续引领,开辟5G Massive MIMO绿色新赛道”的主题发言,分享了Massive MIMO的下一个突破性创新方向,引领绿色5G网络建…

MRTG—网络监控工具
最近一段时间在研究后台服务器测试技术,需要对后台服务器的各项性能指标进行实时监控和统计,也由此让我回想起之前公司曾经接触过的一个服务SNMP,SNMP是一种称之为简单网络管理协议的服务,主要是用于获取系统的流量、I/O、CPU、Me…

IBM会话设置和覆盖规则
为什么80%的码农都做不了架构师?>>> 中文版地址:http://www-01.ibm.com/support/docview.wss?uidswg21659740 Technote (troubleshooting) Problem(Abstract) It is possible to set the HTTP Session time-out in various places on th…

FOSCommentBundle功能包:设置Doctrine ODM映射
Step 2b: Setup MongoDB mapping The MongoDB implementation does not provide a concrete Comment class for your use,you must create one: MongoDB实现并不提供为您所用的具体评论类,您必须要创建一个。 1234567891011121314151617181920212223<?php// src…

lighttpd 负载均衡-反向代理+cache浅谈
Lighttpd有硬盘级别的cache-(mod_cache)和内存级别的cache(mod_mem_cache),内存级别的cache是国人的产品,我喜欢用lighttpd就是因为它具有2种选择的cache,像我的实际需求,由于系统存在很多图片,但是容量不大…

设置网页标题图标
网页图标如图上位置 设置语句如下: link rel:"SHORTCUT ICON", href:"/images/logo.ico"

DeepMind 的新强化学习系统,是迈向通用人工智能的一步吗?
作者:Ben Dickson来源:数据实战派前言尽管已经掌握围棋、星际争霸 2 和其他游戏,深度强化学习模型的主要挑战之一是,它们无法将其能力泛化到训练领域之外。这种限制使得将这些系统在现实世界中的应用变得非常困难,因为…

无法访问D盘,执行页内操作时的错误
打开D盘后出现“无法访问D:/,执行页内操作时的错误”怎么办?既便D盘有病毒也不会出现这种状况,初步判断是D: 分区表错误,用系统安装光盘开机进入纯DOS下的修复模式中用 CHKDSK /R 或 /F来修复一下试试看。在cmd下输入chkdsk空格d:空格/f本文转…

怎样修改Ubuntu的root帐户密码并使用root登录
Ubuntu版本11.04 Ubuntu是一套基于Debian的Linux系统,它追求的是“Just Work”,最新的7.10版本发布于2007年10月,不同于其他Linux发行版本,Ubuntu的所有版本都是免费的,包括企业版。第一次安装Ubuntu,发现比…

CSDN 开学见面礼!限时免费申请,手慢无!
暑假即将结束,金秋开学季来袭。别让年轻的自己虚度光阴,现在扫码申请学习资格,10+场考前辅导,600+分钟大咖讲解与答疑直播免费看!大厂CTO级别导师陪你加buff!3周带你掌握大厂工程师基…

【No.1_sizeof与strlen】
【注意】 程序语言只是我们与计算机交流并让计算机实现我们创造性思想的工具,可以并鼓励深入掌握一门语言,但千万别沉迷于钻某种语言的牛角尖,一定要把握好二者间的度 本帖属不定时连载贴,以试卷的形式提出一个比较基础的问题供大…

Linux: CentOS 7下搭建高可用集群
转载: http://linux.cn/article-3963-1.html本文以两台机器实现双集热备高可用集群,主机名node1的IP为192.168.122.168 ,主机名node2的IP为192.168.122.169 。一、安装集群软件必须软件pcs,pacemaker,corosync…

史上最大规模 DDoS 攻击,每秒 1720 万次 HTTP 请求
整理 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 互联网基础设施公司 Cloudflare 表示,已化解了迄今为止所记录的最大规模的容量耗尽分布式拒绝服务(DDoS)攻击。 近日,互联网基础设施服务提供商 Cloudfl…

如何查看当前Linux的版本
查看linux的版本主要有三种方法:1) 登录到服务器执行 lsb_release -a ,即可列出所有版本信息,例如:[root3.5.5Biz-46 ~]# lsb_release -a LSB Version: 1.3Distributor ID: RedHatEnterpriseASDescription: Red Hat Enterprise Li…

AIX5.3安装bash shell
一、下载bash shell,地址是:ftp://ftp.software.ibm.com/aix/freeSoftware/aixtoolbox/RPMS/ppc/bash/ 二、安装bash shell,rpm -ivh bash-3.2-1.aix5.2.ppc.rpm三、你现在就可以用了,赶紧bash试试!----你可能会有疑问我的系统的是…

经典算法题每日演练——第六题 协同推荐SlopeOne 算法
原文:经典算法题每日演练——第六题 协同推荐SlopeOne 算法相信大家对如下的Category都很熟悉,很多网站都有类似如下的功能,“商品推荐”,"猜你喜欢“,在实体店中我们有导购来为我们服务,在网络上 我们需要同样的一种替代物&…

基于 Python 环境搭建 - YOLO 实现吸烟行为监测
作者|李秋键 出品|AI科技大本营(ID:rgznai100) 引言 目标检测是一种与计算机视觉和图像处理有关的计算机技术, 用于检测数字图像和视频中特定类别的语义对象 (例如人、建筑物或汽车等), 其在视频安防,自动驾驶, 交通监控, 无人机场景分析和机器人视觉等领域有广阔的应用前景。近…

Ubuntu 下安装thttpd Web服务器
不知道大家是不是真的需要用appache这么复杂的功能这么强大的web server,其实有很多时候使用webserver也只是一种远程共享访问的方式。这里,Ubuntu repository的提供了一个简单的web server,名为thttpd,即 tiny http daemon. th…

mysql 新增 删除用户和权限分配
1. 新增用户 mysql>insert into mysql.user(Host,User,Password) values("localhost","lionbule",password("hello1234")); mysql>flush privileges; 2. 修改用户密码 mysql>update mysql.user set passwordpassword(new password)…

简历空空,如何编写一个面试时能拿的出手的真实项目?
最近,新一波的秋招全面开启,各大互联网行业像腾讯、百度、美团、哔哩哔哩,都加入到招聘队伍,秋招面试也进入白热化。作为一名求职者,要想在招聘浪潮中抢先一步,锁定大厂Offer,现在就要着手准备起…

mysql通过查看跟踪日志跟踪执行的sql语句
在SQL SERVER下跟踪sql采用事件探查器,而在mysql下如何跟踪sql呢? 其实方法很简单,开启mysql的日志log功能,通过查看跟踪日志即可。 开启mysql的日志log方法: windows环境下的配置方法: 我使用的版本&#…

用thttpd做Web Server
httpd是busybox中自带的web server,功能弱,不支持认证和CGI。thttpd和boa都支持认证CGI,功能比较全,Boa是一个单任务的小型http服务器,设计的小型系统不要数据库操作,所以可以使用thttpd作为server.1. 编译thttpdccarm…

ii第六单元 文本处理工具
linux中常用的基础命令 diff 命令 patch 命令 grep 命令 Cut 命令 sort 命令 uniq 命令 tr 命令 sed 命1.diff 命令 比较两个文件的不同 用于创建补丁文件 diff -u file file.new >file.path ##生成补丁文件 yum install patch -y ##安装打补丁工具 (1&…

Powershell管理系列(十)邮件联系人及邮件用户的管理
鉴于有些用户不太熟悉邮件联系人、邮件用户的区别,博文首先介绍下用户邮箱、邮件联系人、邮件用户的概念,以下介绍部分博文摘自winos微软中文技术论坛。---------------------------------------------------------------------------------------------…

移植 thttpd Web服务器
从http://www.acme.com/software/thttpd/ 下载thttpd 到/tmp 目录当中,并解压. 编译thttpd [armlocalhost thttpd-2.25b]$ CCarm-linux-gcc ./configure --hostarm-linux [armlocalhost thttpd-2.25b]$ vi Makefile 指定静态链接二进制文件 LDFLAGS -static …

懂外语、会创作,机器高质量学习挑战均在这里实现
编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 近年来人工智能在不断的发展中,机器不仅已经学会了英语写作,也正在学习其它语言。 德国 Aleph Alpha 已经构建了世界上最强大的 AI 语言模型之一。它不仅能说流利的英语…

JPA 复杂查询 - Querydsl
添加依赖 <!--query dsl --> <dependency> <groupId>com.querydsl</groupId> <artifactId>querydsl-jpa</artifactId> </dependency> <dependency> <groupId>com.querydsl</groupId> <artifactId>qu…

服务器端开发经验总结 Linux C语言
简介在进行服务器端开发的时候需要考虑一些算法和性能问题,经过了几年的开发,对这方面有了一些经验,现在写下来跟大家分享和讨论。我主要是在Linux下进行C语言的开发,所以后面的实现都是基于Linux操作系统并用C语言来讲解。其它平…