全球缺芯大潮中,以软代硬能否另辟蹊径?
在5G和人工智能的技术浪潮如约而至以后,业内人士无不对IoT产业的未来报以极大的期待。以人工智能和家居设备为基础,再加上算力与网络支持,有理由相信未来IoT相关产业必将迎来爆发。然而今年,席卷全球的芯片产能不足问题影响到了各行各业,其对于普通人影响或许是价格,但对于企业而言,其事关生死存亡。尤其是扎根于各类智能设备的企业而言,如何提升芯片效能,提升端侧的智慧能力,这几乎可以被视作2021年IoT产业生存的第一要务。
与此同时,我们还能看到太多的算法模型在走向极致,对于用户苛刻的智能需求,巨大模型在不断地完善和构建;而对于一些高频次和便捷性的智能需求,能够运行在边缘侧的小模型也同样受人欢迎。当芯片产能无法在一朝一夕之间解决,从生产线的构建到各类原材料价格,哪怕是再小的因素都可能形成蝴蝶效应,那么是否有可能从边缘侧,在终端上,借助软件的力量来实现芯片的升级呢?
这一想法当然不是没人能想到,CoCoPIE便是在尝试的企业之一。在国庆期间,笔者也与远在硅谷的CoCoPIE公司负责人李晓峰博士连线,一起聊了关于芯片,关于AI,也关于当下的这些故事。
5G和AI如约而至,边缘的浪潮来了吗?
在加入CoCoPIE之前,李晓峰博士就已在终端产业做出了诸多成绩。14年的英特尔职业生涯,从超级计算到服务器计算,又到个人机计算,再到后来移动计算,他领导团队开发的微运行时系统在英特尔的平台上被广泛部署。在大潮汹涌而过时,李晓峰博士看到了端侧计算的重要性不断扩展,行业巨头们的探索接踵而至,端侧用户价值不断提升。于是,李晓峰博士便带领Intel中国运行时实验室,在谷歌正式发布Android之前便开始了Android的研究和优化工作,曾负责Android系统在英特尔移动平台上的性能、功耗和流畅性,并开发了业界的第一个Android评测套件。在离开英特尔时,李晓峰博士对端侧技术和用户需求就已经有了非常深刻的理解。

此后,李晓峰博士的工作一直围绕着端侧智能设备相关技术。曾任华米美国分公司总经理,兼技术副总裁,负责协助建立美国研发团队,并领导团队进行健康手环产品的软件和算法研发;还曾担任华为技术副总裁,在华为美研带领团队研发下一代操作系统,并负责基于深度学习的移动感知平台的构建,研发应用于移动设备的智能感知算法;加盟CoCoPIE之前,李晓峰博士是OPPO软件的首席架构师,负责基础软件技术的战略和实施。
丰富的业界经验与技术攻关成绩,让李晓峰博士对端侧设备智能化的需求有了更加深入的理解,那么端侧智能市场的未来,会有怎样的脉络呢?CoCoPIE对端侧智能相关市场进行过一番深入的调查,并且找到牛津大学商学院的咨询机构,对端侧AI中的IoT智能设备、媒体娱乐应用以及芯片三大应用市场进行了系统分析。在未来,端侧AI有着巨大的市场需求,其市场空间可能高达1.06万亿美元。
通过端侧AI能够有效的降低云侧成本,使得数据存储和前期的分析等可以放在端侧执行,从而降低云侧计算、网络流量等成本;更重要的是,因为端侧AI不需要把数据上传,有效地满足了呼声日高的用户数据隐私和安全保护需求;在媒体娱乐方面,对用户体验的提升成为端侧服务以及设备提供商的主要竞争热点,越来越多的智能玩法出现在生活之中,如变脸增强,智能交互等娱乐手段也不再新鲜,而端侧AI的实时处理能力,相比云侧计算可以实现用户体验的飞跃式提升,并使能大量通过云服务无法实现的新型体验;而芯片侧则是当下的热点话题,由于芯片产能不足,高端芯片的供货也存在一定空缺,另一方面,端侧AI的需求对端侧算力的需求又大大增加。要解决这个矛盾,通过软件优化技术,可以降低对专用芯片、高端芯片的需求,缩短产品研发周期,从而实现以软件技术来改善、促进芯片产业的发展,在当前和未来都有着巨大的发展空间。
李晓峰博士认为,数字化的发展历史就是让计算设备更加智能化、让智能不断渗透物理世界的过程,从计算器到计算机,再从计算机到智能设备,这一趋势一脉相承。上一代设备智能化发展的核心手段是在设备上植入芯片来运行软件应用,而当前这一代设备智能化的核心手段则是在设备上支撑深度神经网络的AI应用,这是数字化发展的必然,是不可阻挡的趋势。因此,李晓峰博士在这一趋势中顺势而为,投身于CoCoPIE创业,希望通过解决AI计算中的瓶颈问题,改变人们的生活。
当前实现AI普及最大的瓶颈问题就是,随着AI技术的发展,模型变得越来越大,算力需求因此也越来越大。随着各种超大模型的诞生,AI任务的运行甚至要上超算才能解决算力的问题。可是,AI并不是高算力平台的专利,端侧也一样需要AI智能化。CoCoPIE便是通过软件优化技术,大幅度提升AI任务的运行效率,让非专业芯片获得超越专业芯片的效率,也可以让专业芯片的效率进一步增益,从而达到AI能力普及化的目的。
软件与硬件的交织,对于AI模型的另一种尝试
在过去的几年里,我们看到海量的AI创业公司如雨后春笋般冒出,却又一批批的悄然消失。最终留下来的,要么技术雄厚,要么家底雄厚,由此不难看出,AI产业不仅仅有技术的门槛,也有行业的门槛存在。有实力的厂商往往需要自己研发专用芯片来从硬件架构方面实现适配深度神经网络算法,在李晓峰博士看来,这样做的问题就在于研发周期和技术投入都会很高,风险和挑战也会很大。CoCoPIE的做法是针对芯片特性对模型进行优化,实现在不降低模型精确度的情况下,在通用芯片上的效能超过专用芯片。同时,其作为一种软件的技术,与AI专用芯片并非互斥,而是可以进一步释放其潜在能力。
举例来看,当我们在看视频的时候,云侧往往需要在云端存储同一个视频的各种分辨率的视频内容,然后根据网络带宽情况或用户选择,通过网络传输到用户设备上。但是如果改为由端侧设备自动将低分辨率的视频提升为高分辨率,云侧只需要存储一种低分辨率的视频内容,通过网络也只需要传输低分辨率内容,这样就能够有效降低对云侧存储、网络带宽的要求。但要在端侧实现高性能的实时超分辨率,目前对端侧算力、功耗有较高要求,这也是目前超分辨率技术在端侧设备迟迟不能普及的根本原因。通过CoCoPIE在端侧的软件优化技术,已经可以轻松做到在通用手机平台芯片上的实时超分辨率,根据平台需求可以达到30FPS甚至60FPS,实现对网络服务商、手机设备商、终端消费者的多赢。
把AI任务运行到端侧设备上,往往需要做两步,压缩和编译。而CoCoPIE技术的与众不同之处在于对压缩和编译的协同设计,也就是在压缩时考虑编译器和芯片结构特征,从而找到最佳压缩策略,为编译做好准备;在编译时则充分利用压缩模型的结果,对芯片进行针对性代码生成。简单来讲,就是根据第一性原理,先找到最优解的方法,然后根据实际情况进行甄选,让实际情况逼近最优结果。依据这一规则,CoCoPIE的技术可以同时实现精确度和高性能。
AI模型压缩的方法在业界有很多,其中主流的是权重剪枝和量化。权重剪枝的技术又可以分为结构化和非机构化两种,二者各有利弊,结构化剪枝只能对过滤器和通道进行剪枝,剪枝结果规则,对硬件加速和计算效率提升较好,问题是剪枝粒度粗,准确率降低;而非结构化剪枝则可以使得剪枝维度做到很小,而且准确率也很高,但问题是剪枝不规则,对硬件不友好,能耗较高,且计算效率不高。
那么有没有第三条路呢?显然是有的,CoCoPIE提出了基于模式的剪枝方式,在结构化和非结构化之间寻找平衡,塑造一种细粒度的结构化剪枝,在多种剪枝结果中寻找最优解,确定匹配AI模型和芯片平台的最佳压缩模式。根据协同设计原则,CoCoPIE框架由两个组件组成:CoCo-Tune和CoCo-Gen。
CoCo-Tune的主要任务是剪枝和压缩,在训练过程中,网络的体量足以允许局部网络的重用,利用这一性质,其通过模块化局部网络重用,能够显著缩短确定要修剪的适当DNN参数集的过程。CoCo-Gen可以根据结果进行微调和生成,进行细粒度的剪枝和最优适配代码的生成,也就是通过基于模式的DNN剪枝与基于模式的感知生成代码相协同,生成高效的 DNN 执行代码。
边缘的AI,设备的未来
在李晓峰博士看来,设备是为人服务的,也是人能力的一种延伸。比如计算机是人大脑的延伸,相机是人的眼睛的延伸,各种端侧设备也都与人们的生活十分贴近。当人在与数字世界交互时,设备就是人类与数字世界之间的入口和出口,AI的能力不论多强,最终都必须要通过端侧设备这个门户。端侧设备作为入口,需要提供大量对人们活动、意图的感知能力,从而更好地理解人本身;而作为出口,端侧设备则需要给人提供更加愉悦的感官体验和新型服务体验。这一切的技术革新,意义深远,而背后则意味着对端侧AI能力的极大需求。
其实不仅仅是手机、家电这些设备,就是更加复杂的边缘设备也可以从CoCoPIE的技术中获得巨大的收益。例如,通过CoCoPIE的解决方案,可以在几百美金的芯片上,实现上万美金级别的无人驾驶专用平台能力。这些技术所展示出来的巨大潜力,对各类移动侧、边缘侧的客户都有很大的吸引力。因此包括互联网大厂,芯片平台提供商,手机厂商,美国交通部以及某无人驾驶公司等十余家企业已然成为了CoCoPIE的合作伙伴。
作为技术产品,CoCoPIE交付服务的方式也是多样化的,主要包括了完整的自动化工具链和AI模型仓库,可以通过许可授权或云服务来使用。同时CoCoPIE也在平台厂家进行软硬一体化设计,针对特定硬件平台进行整体的加速方案集成。
当然,端云结合的趋势在AI领域也一样存在。未来AI在端侧和云侧将各司其职,端侧承接入口和出口的任务,云侧依然可以是中军帐,二者必将同步前进。在今年8月,CoCoPIE完成数千万元A轮融资,李晓峰博士认为公司下一阶段还将集中精力发展核心技术及其产品,并不断提升技术壁垒,比如侧重用户数据安全隐私的计算技术,对平台能力动态适配的自适应技术等;另一方面,CoCoPIE也会积极拓展自己的合作生态,让更多的合作伙伴通过优异的端侧AI能力为他们的客户提供更好的服务。
未来AI是无处不在的,这一点毋庸置疑,李晓峰博士表示:“上一次的浪潮中芯片随着智能设备变得无处不在,而下一波浪潮里AI将会随着芯片变得无处不在,我们的目标就是‘凡有AI处,就有CocoPIE’。”
相关文章:

Xtrabackup实现数据的备份与恢复
Xtrabackup介绍Xtrabackup是由percona开源的免费数据库热备份软件,它能对InnoDB数据库和XtraDB存储引擎的数据库非阻塞地备份(对于MyISAM的备份同样需要加表锁);mysqldump备份方式是采用的逻辑备份,其最大的缺陷是备份…

最简单的CI框架入门示例--数据库取数据
这个写给初学者看,这是最简单可以调通的例子,网上很多例子其实初学者本地跑不通,缺这少那。 1.下载CI框架(自己找)2.配置 database.php配置: 为数据库服务器设置 connection 参数: $db[defau…

ST-GCN 实现人体姿态行为分类
作者 | 李秋键 出品 | AI科技大本营(ID:rgznai100) 引用 人体行为识别是计算机视觉及机器学习方面的热门研究领域。它在对视频中的人类行为进行运动分析、行为识别乃至延伸至人机交互领域都有着非常广泛的应用。研究初期,人体行为识别主要是以…

【原创】Kakfa utils源代码分析(三)
Kafka utils包最后一篇~~~ 十五、ShutdownableThread.scala可关闭的线程抽象类! 继承自Thread同时还接收一个boolean变量isInterruptible表明是否允许中断。既然是可关闭的,因此一定不是守护线程,而是一个用户线程(不会阻塞JVM关闭)。提供的方…

Oracle的分页查询
为什么80%的码农都做不了架构师?>>> 因为Oracle不像MySQL一样有limit函数来实现分页查找,oracle要实现分页查询可使用关键字rownum来处理。使用rownum有以下几点需要注意: 1、ROWNUM存在使用规则,在单个子查询中&…

微软成功抵御峰值高达 2.4Tbps 的 DDoS 攻击
整理 | 祝涛 出品 | CSDN(ID:CSDNnews)微软表示,他们成功抵御了一场发生于8月份的2.4Tbps分布式拒绝服务(DDoS)攻击,这次攻击超过了去年针对亚马逊Web服务的2.3Tbps最大攻击。这场攻击持续…

百度吴甜:首席AI架构师培养计划持续为行业输送高端复合型AI人才
CSDN 导语: 随着 AI 技术的发展,关注 AI 的开发者与日俱增:据 CSDN 发布的《中国 AI 应用开发者报告》显示,在 CSDN 的注册开发者中,689 万开发者有阅读、撰写和研究 AI 技术行为,其中精准聚焦 AI 学习和应…

Htaccess文件是什么以及Windows下自由创建.htaccess文件的N种方法
.htaccess是什么 概述来说,htaccess文件是Apache服务器中的一个配置文件,它负责相关目录下的网页配置。 通过htaccess文件,可以帮我们实现:网页301重定向、自定义404错误页面、改变文件扩展名、允许/阻止特定的用户或者目录的访…

Linux grep,egrep及相应的正则表达式用法详解
linux在进行文本处理过程中的文本搜索工具称为正则表达式。文本搜索工具有grep、egrep、fgrep,egrep为正则表达式的扩展正则表达式,fgrep用于搜索文本字符串,与 grep 和 egrep 命令不同,因为它搜索字符串而不是搜索匹配表达式的模式。grep的含…

Java GC 日志解析
JVM 在Java应用程序优化中是不可缺少的一大重项,如何合理配置Java参数,如果验证配置参数的有效性,从GC日志中可以获得很重要的提示,以下是笔者对GC垃圾收集器默认开启的组合日志的部分的解析,希望能帮到想学习的同学O(…

MySQL 备份和恢复策略
在数据库表丢失或损坏的情况下,备份你的数据库是很重要的。如果发生系统崩溃,你肯定想能够将你的表尽可能丢失最少的数据恢复到崩溃发生时的状态。本文主要对MyISAM表做备份恢复。 备份策略一:直接拷贝数据库文件(不推荐ÿ…

zookeeper学习记录
2019独角兽企业重金招聘Python工程师标准>>> 背景 前段时间看了S4流计算引擎,里面使用到了zookeeper进行集群管理,所以也就花了点时间研究了下zookeeper,不求看懂所有源码,但求了解其实现机制和原理,清楚其…
Ubuntu的apt-get使用国内的源
1、复制原文件备份 sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak 2、打开清华大学TUNA官网发布的Ubuntu 镜像使用帮助。 3、复制下面框中的内容,打开自己的Ubuntu系统。 4、 将框中的内容替换掉原来的所有内容 sudo gedit /etc/apt/sources.list 5、 进…

51单片机实现对24C02进行页写、顺序读取并显示验证
源:51单片机实现对24C02进行页写、顺序读取并显示验证 //************************************************************************************* //**程序名称:51单片机实现对24C02进行页写、顺序读取并显示验证 //**编写人:**** //**修…

配置MySQL主从复制
MySQL支持单向、异步复制,复制过程中一个服务器充当主服务器,而一个或多个其它服务器充当从服务器。主服务器将更新写入二进制日志文件,并维护日志文件的一个索引以跟踪日志循环。当一个从服务器连接到主服务器时,它通知主服务器从…
PHP 单元测试
本文首发于 https://jaychen.cc/article/34作者 Jaychen朋友,你听说过安。。。不是,写过单元测试吗。 单元测试是开发过程中必不可少的一环,一个项目有良好的单元测试代码,重构的勇气都大很多。这次写一篇小文来介绍一下 PHP 的单…

CI框架如何删除地址栏的 index.php
默认 CI 框架显示地址是 http://localhost/ci/index.php/test/ 去掉index.php这样会更好些。1.修改Http.conf的 LoadModule rewrite_module modules/mod_rewrite.so 去掉注释2.ci根目录增加.htaccess文件 <IfModule mod_rewrite.c>RewriteEngine OnRewriteBase /ci#Remov…

网站安全配置(Nginx)防止网站被攻击(包括使用了CDN加速之后的配置)
2019独角兽企业重金招聘Python工程师标准>>> 网站被攻击是一个永恒不变的话题,网站攻击的方式也是一个永恒不变的老套路。找几百个电脑(肉鸡),控制这些电脑同时访问你的网站,超过你网站的最大承载能力&…

除了 AI,这些技术为 IIoT 插上飞向“4.0”的翅膀
“中国制造2025、德国工业4.0、美国先进制造”——在21世纪的工业领域,“制造强国”开启新一轮角逐。尽管实现路径各有侧重,但题中之义均是通过互联网和智能技术实现企业生产和管理的降本增效。正因此,IIoT被视为助推智能制造转型升级的“催化…

[20171225]查看并行执行计划注意的问题.txt
[20171225]查看并行执行计划注意的问题.txt--//如果使用dbms_xplan.display_cursor查看并行执行计划注意一些问题,通过例子说明:1.环境:SCOTTbook> &r/ver1PORT_STRING VERSION BANNER------------------------------ -------------- ------…

expires与etag控制页面缓存的优先级
expires指令控制HTTP应答中的“Expires”和“Cache-Control”Header头部信息,启动控制页面缓存的作用time:可以使用正数或负数。“Expires”头标的值将通过当前系统时间加上设定time值来设定。time值还控制"Cache-Control"的值:负数表示no-cac…

API 大赛决赛名单出炉,速来围观!
创新云转型,智慧云服务2021年移动云API应用创新开发大赛正在火热进行中各个赛道激烈PK优秀开发者同台切磋彰显实力!10月14日,2021年移动云API应用创新开发大赛复赛在中移软件园双创路演大厅圆满举办。本次复赛分为移动赛道和企业赛道分别进行…

将日期yyyy-MM-dd转为数字大写的形式
/*** 将日期转大写* 例如:2013-05-13转为 二0一三年五月十三日* param date* return */public static String getDxDate(String date){String dateArr[] date.split("-");String year dateArr[0];String month dateArr[1];String day dateArr[2];Str…

DevExpress v17.2新版亮点—WPF篇(四)
2019独角兽企业重金招聘Python工程师标准>>> DevExpress年终击穿底价,单套授权低至67折!仅剩最后6天!查看详情>>> 用户界面套包DevExpress v17.2终于正式发布,本站将以连载的形式为大家介绍各版本新增内容。本…

CI框架验证码CAPTCHA 辅助函数的使用
使用CAPTCHA 辅助函数很方便生成验证码,但是图片是存储在文件夹下,不是输出流,感觉不够完美,可以拿来用用。 说明:产生4位的随机数,CI根目录下建立captcha文件夹。 <?php $this->load->helper(ca…

GitLab 上市,市值高达 149 亿美元!GitHub 的头号劲敌来了
整理 | 祝涛 出品 | CSDN当地时间周四,知名代码和资源托管服务平台 GitLab(股票代码GTLB)完成了IPO(首次公开募股),在纳斯达克成功上市。GitLab在本次 IPO 中筹集了约 6.5 亿美元。GitLab此前曾计划I…

将ubuntu系统设置静态ip及ssh
2019独角兽企业重金招聘Python工程师标准>>> sudo vim /etc/network/interfaces 输入以下:auto lo iface lo inet loopback auto eno1 iface eno1 inet static address 192.168.1.197 netmask 255.255.255.0 gateway 192.168.1.1 dns-nameserver 192.168…

ECMAScript 5 —— 单体内置对象之Math对象
ECMAScript 还为保存数学公式和信息提供了一个公共位置,即 Math 对象。与我们在 JavaScript 直接编写的计算功能相比,Math 对象提供的计算功能执行起来要快得多。Math 对象中还提供了辅助完成这些计算的属性和方法。 一. Math 对象的属性 Math 对象包含的…

织梦内容管理系统修改
1.如何去掉互动中心 修改根目录下templates——default——index.htm文件,删除以下内容 <div id"rightAD1" style:margin:10px auto"></div> <div class"usercenter">.....到</div> <!-- /usercenter --&…

斯坦福大学 AI100 报告发布:AI 发展速度惊人,但风险也正走进现实
作者 | 阳光来源 | 学术头条语言处理、计算机视觉和模式识别的巨大进步,意味着人工智能(Artificial Intelligence,AI)每天都在与人们的生活进行交互,从帮助人们选择电影,到帮助人们解决医疗诊断难题方面…