十年磨一剑,可重构计算架构将引领未来芯片市场
2019 年 6 月,AI 芯片创业公司清微智能首款可重构计算架构 AI 芯片实现量产的消息在业内迅速传开,可重构计算架构芯片再次引发一波讨论的热潮。经历过十多年的技术积累,这枚小小的芯片在全球芯片市场中开启了全新的篇章。
时光倒流,20 世纪 60 年代,可重构的概念早在就被提出。追根溯源,可重构芯片最早的技术源于 20 世纪 80 年代末诞生的高层次综合理论和方法。
直到 2006 年,意识到可重构计算架构对于提升芯片算力、降低功耗的巨大优势,清华大学的魏少军教授牵头成立了清华大学可重构计算研究团队。成立十多年,该团队一直进行可重构计算理论和架构研发,在国际核心学术期刊和会议发表数百篇论文,并先后获得教育部技术发明一等奖、中国发明专利金奖,国家技术发明二等奖。
2015年,可重构芯片因为第三次 AI 热潮开始受到关注。
2017年6月,清华大学可重构计算研究团队的第一代人工智能芯片Thinker-Ⅰ推出,并获2017 ACM/IEEE ISLPED会议设计竞赛奖。研究团队还在ISCA 2018发表了中国唯一第一作者论文。
2016年、2017 年,清华大学可重构计算研究团队推出三款基于可重构计算架构的 Thinker 系列芯片。Thinker 系列芯片具有极高的灵活性,能支持各种 AI 算法,依托其动态配置的特点,Thinker 芯片具有很高能效比,初次展露锋芒。
2018 年 7 月,北京清微智能科技有限公司脱胎于清华可重构计算团队,在在北京中关村注册成立。
2018 年第三季度,清微智能悄然完成近亿元级天使轮融资,投资方包括百度战投、分众传媒、禧筠资本、国隆资本、西子联合控股等,再次引起芯片界的关注。
2019 年 6 月,清微智能成功量产了首款可重构芯片 TX210,从成立到量产,清微智能用了短短一年时间。看到这里,大家大致会明白,这个刚踏入产业界门槛的“新人”并非“一夜成名”,而是基于十多年的技术积累,积攒了 200 多项技术专利后的厚积薄发。
回顾了让可重构计算架构成为万众瞩目焦点的背后大佬之后,我们回过头来看看,这“可重构计算架构”究竟是什么。
据第一代可重构计算架构的缔造者魏少军解释,CGRA(Coarse-grained Reconfigurable Architecture)是一款新型的可重构计算架构,而可重构芯片不属于 CPU、GPU、FPGA 或 ASIC,它是一种全新类别的芯片。因为其特点是软件硬件都可以编程、混合粒度、芯片的硬件功能随软件的变化而变化,应用改变软件、软件再改变硬件,所以无论是在国内还是国外,可重构芯片很多时候被误解成 FPGA。
但它的技术原理与前者并不相同。
与 CPU、GPU、FPGA 和 ASIC 相比,CGRA 最大的优势在于,一是没有传统指令驱动的计算架构取指和译码操作的延时和能耗开销,二是在计算过程中以接近“专用电路”的方式执行,因此平均计算能效分别是前三者的 1000 倍以上、100~1000 倍、100 倍以上,相比 NPU 也有 10 倍以上的性能提升。另外,由于 CGRA 基于配置方式执行,执行效率与 ASIC 相当,但是灵活性远远好于 ASIC。更重要的是,CGRA 架构算力可以弹性扩展,适用于从云端到边缘端对高能效和灵活性有综合要求的场景。
集众多优势与一身,可重构计算芯片成为即将到来的 5G 时代下终端设备的最佳候选之一,可重构架构可以提升 AI 芯片的能效比,在保证 AI 计算效率和精度前提下降低功耗。而基于可重构计算架构的软件定义芯片使得硬件架构功能随软件的变化而变化,实现更灵活的芯片设计,同时也具备处理器的通用性和 ASIC 的高性能和低能耗,被一些专家视为 AI 通用芯片的方向之一。
你对可重构计算架构感到好奇吗?这个或将成为未来芯片市场主流的架构设计究竟有何非同一般之处?为跟上技术潮流,你一定不会想要错过这次机会:清微智能 CTO 欧阳鹏将亲临本次免费公开课直播间,面对面详解可重构计算架构,对这个话题感兴趣的童鞋可实时提出自己的疑问,欧阳鹏博士将在直播间与观众互动并答疑。
课程大纲:
1、芯片产业背景分析、发展趋势及未来业界应对变化的方法
2、可重构计算技术的技术实现原理、优势与价值
3、可重构计算芯片如何执行不同算法或应用的计算
4、开发者与技术人员需要掌握的专业知识与开发工具推荐
内容介绍:
可重构计算是一种可根据不同的应用或算法灵活重构硬件资源的新型芯片架构技术,既能在极低功耗下实现高性能计算,也能无缝衔接各类智能算法,具有极强的通用性。CGRA 是完全中国自主知识产权的原创技术,目前中国已有基于该架构的产品量产。CGRA 被《国际半导体技术路线图》评为最具前景的未来计算架构,英特尔、英伟达等企业也从去年开始布局相关芯片业务。
本次课程涉及可重构计算的架构和配置机制,可重构计算芯片如何可以根据算法和应用的不同配置硬件资源来执行不同的计算?在实际应用中,可重构计算如何做到高能效和通用性兼备?
课程适合人群以及听众收益
适合人群:芯片技术人员,AI 开发者等
学习收获:对芯片技术发展方向有新的认识,对于芯片新型架构有所了解。
讲师介绍:
欧阳鹏,清微智能 CTO,清华大学微电子研究所博士。TCAS-I, TCAS-II, TCSVT 等期刊审稿人。十余年算法和计算架构研究设计经验,是可重构架构的重要参与人。先后负责多款芯片的设计流片,包括面向计算机视觉的 Lasa 芯片,面向人工智能应用中物体的 thinker 系列芯片。
在 JSSC,TC, TCAD,TCAS I 等期刊发表学术论文五十余篇,申请专利二十余项。受邀出席DAC,VLSI,CICC,DATE,FCCM,ICPR,WACV 等多个国际顶级会议。参与国家 863,国家核高基,清华-帝国理工国际研究,清华-紫光横向等重大项目研发,获得“教育部科技成果鉴定完成者认证”、2017 ISLPED design contest finalist 、DAC2019 Low-Power Object Detection Challenge亚军等荣誉。
加入「公开课」交流群,获取更多学习资料,课程信息,热招岗位等
◆
今晚 9 点 公开课
◆
Python系列课之:多继承、super、MRO算法
扫码直接报名
课程大纲:
1. super的基本用法
2. Python多继承
3. MRO算法原理与实战
了解Python多继承原理、super的原理,以及MRO的规则。
相关文章:

PyTorch中nn.Module类中__call__方法介绍
在PyTorch源码的torch/nn/modules/module.py文件中,有一条__call__语句和一条forward语句,如下: __call__ : Callable[…, Any] _call_impl forward: Callable[…, Any] _forward_unimplemented 在PyTorch中nn.Module类是所有神经网络模块…

压缩和归档及vi的使用
1.cat(more less head tail) /etc/passwd :查看/etc/passwd文件内容2.head -13 /etc/passwd | tail -1 :只查看/etc/passwd文件中第13行3.wc -l /etc/passwd :统计/etc/passwd文件有多少行4.grep -v "^#" /etc/inittab | grep -v &…
看到抖音上Python工程师晒得工资条,我沉默了......
我是个抖音中毒者闲来无事就喜欢刷抖音最近刷到了一个Python工程师的工资条然后我默默的打开看了然后我默默的关闭了我想这个工资算下来好像也不算高我就去其他渠道搜索了一下相关的Python工作岗位的工资好吧,都是比这个工资更高的emmm.....此时我很沉默后悔为什么我…

windows上通过cmake-gui生成pytorch工程
在Windows下通过cmake-gui.exe生成不带cuda的Torch.sln工程操作步骤:PyTorch版本使用1.8.1。首先可以先通过打开cmake-gui.exe,指定pytorch源代码目录和生成vs2017工程的位置;然后点击Configure,选中”Visual Studio 15 2017 Win6…

RequisitePro SQL SERVER数据库的配置
安装好Rational RequisitePro后,新建立一个project时,要选择库的类型,可以支持MS Access、SQL SERVER和oralce首先在SQL SERVER里新建一数据库名为”RequisitePro”然后在查询分析器里执行其自带的脚本文件,位置在《Rational安装目…

yum三种方法
RHEL5中实现各种服务的准备条件:(一)、制作YUM本地源:YUM简介:YUM是Yellow dog Updater Modified的简称,yum是软件的仓库,它可以是http或ftp站点,也可以是本地软件池,但必须包含rpm的header&…

损失函数之Cross-Entropy介绍及C++实现
在深度学习中,损失函数用来评估模型的预测值与真实值之间的差异程度,是模型对数据拟合程度的反映,拟合的越差,损失函数的值越大;反之,损失函数越小,说明模型的预测值就越接近真实值,…

C语言应用于LR中-如何得到数组长度
C语言没有提供获取数组长度的函数,最起码我不知道,所以编写了一个函数取数组的长度,调试成功,大家可以试试。另外也可以用sizeof(a)/4来取得整型数组的长度,因为整型占4个字节。效果相同。#include "web_api.h&qu…
6个你必须知道的机器学习的革命性的教训
加入「公开课」交流群,获取更多学习资料、课程及热招岗位等信息作者 | James Warner编译 | ronghuaiyang来源 | 转载自AI公园(ID:AI_Paradise)【导读】机器学习是未来,因为它将广泛应用于计算机和其他领域。尽管如此,开发有效的机…

vim ctags使用方法
一、用好系统自带软件ctags大部分的unix系统都有ctags软件,它能跟vim很好地合作。用途:生成c语言的标签文件,实现相关c文件之间的跳转。用法:1.生成标签文件在当前目录下(运行$提示符后面的命令): $ctags -R .-R表示recursive,递归,为当前目录…

pybind11介绍
pybind11是一个轻量级的仅头文件库,主要用于创建现有C代码的Python绑定,它的源码在https://github.com/pybind/pybind11,license为BSD,最新发布版本为2.9.1。 可将pybind11库视为Boost.Python的一个小型自包含版本(Think of this …
改善AI性别偏见的4种方法 | CSDN博文精选
加入「公开课」交流群,获取更多学习资料、课程及热招岗位等信息作者 | Josh Feast翻译 | 王子龙校对 | 王琦本文阐述导致AI偏见的原因并提出应用的解决方案。任何对AI偏见的审查都需要意识到一个事实:这些偏见主要源于人类固有的偏见。我们创建、训练的模…

C#程序调用外部程序
/**编程语言:VisualStudio.NetC#(Beta2)*作者:迪泊威*功能:通过C#程序调用Windows记事本程序编辑一个*名为test.txt的文本文件。**在整个程序中System.Diagnostics.Process.Start(Info)*为主要语句。*如果只是单独执行一个外部程序࿰…

svn 同步脚本
REPOS"$1"REV"$2"export LANGen_US.UTF-8/usr/bin/svn update /home/wwwroot/yswifi --username yangxc --password yangxc >>/tmp/svn_hook_log.txtecho who am i,$REPOS,$REV >> /tmp_hook_var.txt转载于:https://www.cnblogs.com/xkcp008/p…
DevOps火爆,招人却太难了!
DevOps一词最近两年人们谈的比较多,很多人简单地理解为“Dev”“Ops”,是否将开发人员和运营人员放在一个部门就完事了呢?其实DevOps是一组过程、方法与系统的统称,用于促进开发、技术运营和质量保障部门之间的沟通、协作与整合。…

网络数据包分析软件Wireshark简介
Wireshark是被广泛使用的免费开源的网络协议分析软件(network protocol analyzer)或网络数据包分析软件,它可以让你在微观层面上查看网络上发生的事情,它的功能是截取网络数据包,并尽可能显示出最为详细的网络数据包信息。它的源码在https://…

SEO研究:网站结构
在衡量所有权重之间,网站结构大概占到30%,这也是很多网站排名不好,或者有站长根本不用优化就能获得很好排名的原因。说到结构必须明白两个概念,一个是物理概念,就是文件存放的路径,另一个是逻辑结构。比较好的情况是逻…

form实现登陆操作
这几天想写个保存cookies的网页,先写了个登陆界面,奈何点击登陆后总是无法正常跳转。经查阅资料和询问高手,总算得以解决。 原错误代码如下: <html> <title>SaveCookies</title> <head> <script>fu…

深度学习中的优化算法之BGD
之前在https://blog.csdn.net/fengbingchun/article/details/75351323 介绍过梯度下降,常见的梯度下降有三种形式:BGD、SGD、MBGD,它们的不同之处在于我们使用多少数据来计算目标函数的梯度。 大多数深度学习算法都涉及某种形式的优化。优化指…
死宅福音:乐高不怕多,智能分拣机帮你归类
作者 | 神经小兮来源 | HyperAI超神经(ID:HyperAI)【导读】乐高现在几乎已经是优质玩具的代名词,该品牌旗下最为知名的,莫过于乐高积木。其丰富的形状与多样的玩法,无论大人小孩都喜欢。但是,这…

优化eclipse启动速度
< DOCTYPE html PUBLIC -WCDTD XHTML StrictEN httpwwwworgTRxhtmlDTDxhtml-strictdtd> 最近发现eclipse越来越慢,影响了开发使用速度。经过处理,快了一些,希望给大家一些提示。 1,取消系统的自动折叠 操作方法:…

一个基于J2EE的web应用程序运行起来需要什么?
2019独角兽企业重金招聘Python工程师标准>>> Eclipse ?IDEA?这是目前市面上最常用的开发工具啦,我的理解是这些只是开发工具,是为了方便开发的,而不是web应用程序运行起来必须的东西。 为什么会有些这方面东…

深度学习中的优化算法之MBGD
之前在https://blog.csdn.net/fengbingchun/article/details/75351323 介绍过梯度下降,常见的梯度下降有三种形式:BGD、SGD、MBGD,它们的不同之处在于我们使用多少数据来计算目标函数的梯度。 大多数深度学习算法都涉及某种形式的优化。优化指…
华科提出目标检测新方法:基于IoU-aware的定位改进,简单又有效
作者 | 周强来源 | 我爱计算机视觉(ID:aicvml)【导语】近日,华中科技大学发表了一篇新论文《IoU-aware Single-stage Object Detector for Accurate Localization》,在此论文中作者提出了一种非常简单的目标检测定位改…

js init : function ()
这个init外面应该还有一层,比如 var a { init: function () {...}, exit: function () {...} } 这样的话,可以用a.init()来调用这个函数, <script type"text/javascript">var obj{init:function(str){alert("init调用&…
Google提出移动端新SOTA模型MixNets:用混合深度卷积核提升精度
作者 | Google译者 | 刘畅编辑 | Jane出品 | AI科技大本营(ID:rgznai100) 【导语】目前,深度卷积(Depthwise convolution)在追求高性能的卷积网络中的应用变得越来越流行,但很多研究忽略了其内核…

桌面窗口的一些发现
最近因业务需要,玩了一下全屏问题。后来,对windows xp sp2的桌面窗口产生了兴趣。写了段代码,玩了一下。同时结合网上的一些知识,发现了以下一些现象。(转载请指明出处) 首先窗口名有#32769、Progman、Shel…

三说输入法[转]
如果我愿意,我会不停地说下去,直到烦死你们,谁让我用的输入法快呢。 我说了几句搜狗或股沟输入法的坏话,引来一些人的争论,大大在我预料之中,这年头,当你想说一些知名度较高的人或物的坏话时&am…

回忆之城市搜索
直接看效果点这里 HTML <!DOCTYPE html> <html> <head lang"zh-CN"><meta charset"utf-8"><title> 城市搜索 </title><link rel"stylesheet" href"ui-departure.css"> </head> <b…

ATL::CStringA和std::string之间转换的一些误区
对于刚做windows下VC的开发同学,类型转换应该是一个令其很苦恼的问题。我刚写工作的时候,也为这类问题不停的在网上搜索转换方法。最近工作中遇到一个“神奇”的bug(一般“神奇”的问题往往是低级错误导致的),最后跟踪…