GitHub 标星 20000+,国产 AI 开源从算法开始突破 | 专访商汤联合创始人林达华
作者 | 阿司匹林
责编 | 李雪敬
封图 | CSDN 下载自视觉中国
作为已经有4000多名员工的AI独角兽,商汤的一举一动备受关注。
从2018年开始,奔着“开源、统一、可复现”的目标,商汤开始建设人工智能算法的开源体系。当时,商汤联合创始人林达华教授则主导发起了OpenMMLab项目,今年商汤将其升级为商汤的算法开放体系。
经过两年的发展,OpenMMLab在GitHub上累计收获了超过20000 Star,覆盖10多个研究方向、100多种算法和700多种预训练的模型,可提供开放的基础技术支持、接口标准和算法框架,逐渐形成了完整的体系和组织架构。
然而在自主可控的号召下,作为底层的深度学习框架更受关注。
2020年初,旷视、华为等先后开源 MegEngine 和 MindSpore,商汤 SenseParrots 的下一步动向立即成为业界关注的焦点。
实际上,商汤从创立第一天开始就自主研发深度学习平台 SenseParrots,经过这几年连续三代的迭代,已经形成了非常完整的工业级的深度学习平台。
然而为何商汤选择先开源 OpenMMLab,而不是 SenseParrots,背后是出于什么考虑?会有开源的规划吗?
8月,在苏州举行的全球人工智能产品应用博览会上,CSDN 与林达华教授一起聊了聊商汤的开源规划,以及产学研结合的那些事。
开源框架如何才能发挥更大的价值
CSDN:为什么选择 OpenMMLab 作为切入点?SenseParrots 是否有开源的计划呢?
林达华:商汤有底层的超算平台,有自主研发的深度学习框架,也有上层的各种算法和应用平台,这些是商汤自主研发和原创积累下来的技术体系。为了响应国家的号召和社会的期待,各个 AI 企业都开始有自己的开源战略,商汤也有自己的思考,我们理解开源的一个最重要的目的就是要能够为科研和产业服务的开放技术生态。
开源切入点的选择非常关键。现在在深度学习框架领域,虽然已经有了不少开源框架,但是目前被广泛应用的主要就是 PyTorch 和 TensorFlow,而且已经形成了非常巨大的生态。 不管是每年数以千计的论文,还有各个企业所积累的各种各样的产品,它们背后的代码都是基于这两个框架。
人工智能领域发展到现在,已经形成了一个丰富的体系。一个人工智能应用的建立不仅依赖深度学习框架,还需要多层次的算法、工具、以及各种工程环境的支撑。因此,单纯开放一个训练框架,没有生态的牵引与配合,是很难形成较大的影响力的,也很难给整个业界带来很大的价值。
我们做开源,就是要真正建立一个有影响力的开源生态。我们选择现在相对空白的领域——视觉深度学习领域的开放算法体系OpenMMLab。即使有 PyTorch、TensorFlow 这些底层的深度学习框架,开发者要建立起来一个完备的上层应用,依然需要大量的算法和工程开发工作,而这一块的开源体系还是处在相对初级的阶段,这也是为什么 OpenMMLab 开源了一部分算法库,比如 mmdetection 已经取得了巨大的影响力,OpenMMLab 旗下的其它开源项目的影响力也在持续增长。目前 OpenMMLab 体系在 GitHub 已经有超过20000颗星。
有了生态影响力之后,我们以此为切入点,就可以规划下一步。未来我们会在合适的时机开放更底层的深度学习框架 SenseParrots,它提供了跟 PyTorch 等主要框架兼容的表达层,因此跟OpenMMLab的生态是连接在一起的。只要各种上层应用都是基于 OpenMMLab 来构建,那么我们开源 SenseParrots 等基础设施之后,开发者的迁移成本就会大幅降低,真正带动生态发展。
这是商汤在开源策略上的思考,也是我们朝着真正建立一个有影响力的开源生态而努力的目标。
CSDN:OpenMMLab 的主要优势在哪?
林达华:商汤在计算机视觉和深度学习领域有着非常深厚的技术积累。每一个算法的开发都是一个非常复杂的过程,除了大量的算法设计,还需要大量的工程实践,里面任何一个参数设计错误,就会导致精度达不到应有的水平。
比如,一个简单的检测算法,理解其原理其实不是很花时间,但真正要实现出来,并达到预期的结果, 即使是一个受过专门训练的博士,也会花费大量时间。就像设计一架飞机,虽然基本的物理原理大家都懂,但是要设计出符合性能要求的飞机,需要很长时间的沉淀。
商汤在过去几年里沉淀了大量的设计细节和经验,因此其他人在使用商汤开源的算法时,不需要把同样的坑再踩一遍。对于企业和科研来说,具有非常巨大的价值。
CSDN:商汤开源的目的是什么?OpenMMLab 有商业化的规划吗??
林达华:商汤开源的目的更多是构建人工智能未来的产业生态。一旦建立起生态,整个行业发展起来,大家都会认识到商汤在这个过程中能够提供平台的能力,就会有越来越多的伙伴和企业愿意跟商汤合作,把 AI 推到到更多的行业中。生态的构建给商汤所带来的长远的战略利益是非常的巨大的。
超大模型会成为未来的AI基础设施?
CSDN:CV 领域有哪些令人兴奋的技术或者应用突破?
林达华:自然语言处理领域的 BERT、GPT 等引起了学术界和产业界巨大反响。现在的AI生产模式是遇到一个新的场景,就需要重新积累数据,收集数据,训练一个新的模型,成本高昂。但是从长远来说,我们也在一直在探索,在 CV 领域能不能有类似于 GPT 这种非常强有力的预训练模型。
受到 NLP 领域的启发,CV 领域已经开始有人在探索有没有能够适用于多项应用的预训练模型,在不需要迭代或者非常短时间迭代的前提下,就能够达到实用水平。
我们已经在探索一些新模型训练的方式方法,经过短周期的迭代,就能够满足大量新型应用的性能要求。但是做这方面研究的机构不是很多,因为大模型的训练花费需要非常大的算力支撑,训练一次的花费也是非常高昂的。
商汤在建设大型的人工智能计算平台,一方面支撑产业赋能,另外一方面支撑技术的突破。我们实验室在这方面已经取得了一些初步的成果,可能在下次的会议上,就会看到我们的进展。
此外,我们也在积极探索各种无监督、半监督、弱监督方法,以及通过把模型和各种环境因素结合在一起的方法,来降低对标注数据的依赖。在今年的 ECCV,我们的多篇论文就体现了我们在这个方向所取得的成果。
CSDN:模型越来越大越来越深,这是未来的必然的发展方向吗?它会怎样影响AI生态?
林达华:科研是一个非常多样化的领域,随着超大模型的涌现,如果他们的价值真正能够在广大的场景里面得到验证,会对未来的科研分工模式带来新的变革。
整个科研链条在不同的阶段都需要创新,在应用领域需要创新。当GPT出来之后,它只是一个基础的模型,然而有很多人用非常创造性的方法来使用这个模型,所以应用层可以有很多创新。而有算力资源的人,也可以对这个模型做一些简单的迭代,应用到某种比较新奇的领域。
我其实并不认为全社会和整个科研界都是需要训练大模型。未来整个科研分工可能会有新的改变:少数有充足计算资源和工程能力的大型研究机构或者企业会在核心模型上进行竞争,并且把这些模型能力开放出来作为基础设施,而更多的AI研究者或者从业者则会站在巨人的肩膀上在应用侧进行多种形式的创新,解决产业和生活中的各种场景问题。
大牛回归学术界,是好是坏?
CSDN:一些著名科学家开始从企业回归学术界,是否意味着 AI 科研和工程落地之间存在巨大的鸿沟?商汤内部是如何考核科研的成绩并做好平衡的?
林达华:随着 AI 业务越做越深入,可能在 AI 发展的初期,算法研究员起到了非常大的推动作用,但是随着各个行业AI技术的成熟,行业需求愈发突显,包括商汤在内的企业,商业、产品、运营等人才的作用越来越重要,但是技术创新依然是最重要的源动力。
为了把 AI 推广到更多的行业,需要在技术方面有新的突破。这时有一部分科学家看到这些问题的存在,但是在企业里不一定可以花很长时间投入很多资源去做,对于这些更长期的更具探索性的研究,高校或者大型实验室是可以发挥很大作用的。所以 AI 真正持续长时间的健康发展,一定需要产学研的有机结合。
要解决现在 AI 数据成本等方面的根本问题,需要核心技术的突破。如果一个科学家从未在企业里待过,他看不到问题在哪里。那些在企业界待过的科学家再回归学术界,其实也能带来一些对整个产业发展真正有价值新思考,引领学术跟产业的融合。
商汤对这种事情一直处理得非常好,我们和很多高校实验室都有天然的联系,包括我在内的研究leader都在研究机构和高校里扮演很重要的角色,这样就能够在带动高校研究资源的同时,与企业的联动也更加紧密。
更多精彩推荐
如何在机器学习的框架里实现隐私保护
性能超越GPU、FPGA,华人学者提出软件算法架构加速AI实时化
马斯克脑机接口、BrainOS相继发布,不努力也能有出路了
麒麟芯片或“绝版”,华为多系列手机涨价;一加回应“刘作虎回归OPPO”;DBeaver 7.2 发布| 极客头条
跑路后再删库?思科前员工离职后恶意删库,损失达 240 万美元
相关文章:

那些年,我们一起学过的汇编----之伪指令
弄懂了前面几篇关于基础的文章,下面就开始我们真正的汇编之旅了,在这一篇中我们着重来强调下汇编语言的伪指令。伪指令是汇编语言程序设计中的一个主要的部分,属于控制命令,在汇编语言中的数据定义、存储单元分配、指示程序结果等…

JavaScript-数据引用类型对象
1 <!DOCTYPE html>2 <html>3 <head lang"en">4 <meta charset"UTF-8">5 <title></title>6 </head>7 <body>8 <script>9 //按值传递:两个变量间赋值时,或将变量作为参数传入函数时,其实…
热点 | Excel不“香”了,数据分析首选Pyhton!
Excel一直在求职中有着不可动摇的地位无论是投行、咨询、四大曾经都会在JD中明确要求会Excel,而Excel称霸的时代已经过去!事实上,为了追求更高的效率和质量,他们开始使用比Excel更高效的Python,随后交易收入增长了15%。…

ASP.NET中实现打印
怎样才可以调用打印机进行打印并且对纸张类型进行设置呢? --------------------------------------------------------------- <OBJECT id"WebBrowser" height"0" width"0" classid"CLSID:8856F961-340A-11D0-A96B-00…
you have new email in /var/spool/mail/root/
有时在进入系统的时候经常提示You have new mail in /var/spool/mail/root 解决方法:修改系统配置文件/etc/profile,告诉系统不要去检查邮箱. 具体操作: 命令行输入:echo "unset MAILCHECK" >> /etc/profile 【把…

写时复制,写时拷贝,写时分裂,Copy on write
2019独角兽企业重金招聘Python工程师标准>>> 写时复制,写时拷贝,写时分裂 (Copy-on-write,简称COW)是计算机资源管理方面的一种优化技术,有着广泛的应用,比如内存管理(进…

C#生成pdf的源代码
作者:qieyj(温馨港湾) http://search.csdn.net/Expert/topic/1256/1256076.xml?temp.1866419//write by wenhui.orgusing System;using System.IO;using System.Text;using System.Collections; namespace PDFGenerator{ public class PDFGenerator{static fl…
迁移性好、多用途,港中文提出特征分离的无监督人类三维姿态表征
来源 | 我爱计算机视觉(ID:aicvml)本文将介绍一种基于特征分离的通用人类姿态特征的学习算法Unsupervised Human 3D Pose Representation with Viewpoint and Pose Disentanglement。该算法从无监督的特征分离过程中,习得了一个迁移性好、多用…

解決Linux下Android开发真机调试设备不被识别问题
为什么80%的码农都做不了架构师?>>> 在google找了不少关于这个的资料,各种添加和修改系统文件,但是我的defy依旧没有被识别。尼马的! 好吧,是我低估了Android的sdk的adb调试工具,其实简单的两个…

在Server 2003上部署IIS+PHP+MySQL配置清单
在Server 2003上部署IISPHPMySQL I.安装Windows Server 2003 将光盘放入光驱中,设置BIOS,从CDROM引导加载安装程序,等待启动; 设置注册信息,名字和公司组织名; 填写安装密钥; 设置远程连接数目&…
用Python打造一款文件搜索工具,所有功能自己定义
前言在日常的办公中,我们经常会从一堆不同格式的文件(夹)中搜索特定的文件,可能你是凭着记忆去找或是借助软件,但你有想过如何用Python实现吗?本文将基于几个常见的搜索操作讲解。扫描路径内的内容有些时候我们会希望在当前文件夹…

vlan间路由实验
路由与交换技术实验报告 实验7 vlan间路由实验 班级:130462 姓名:张欣国 学号:13046210 一、 实验目的 1. 了解vlan间路由的不同方法; 2. 了解路由备份; 二、 实验步骤与内容 1. 详细阅读操作过程,认真完…

.net中连接SYBASE的种种问题
作者:zwztu http://search.csdn.net/Expert/topic/1612/1612693.xml?temp.2369806首先如果用OLEDB连呢?如果用ASE 的OLEDB 提供者,那这个提供者哪里有下呢? 其次如果用MSDATASHAPE连,可以是可以,…

struts2中使用标签操作静态方法等
2019独角兽企业重金招聘Python工程师标准>>> 有的时候对<%%>特别敏感,不想用jsp的<% %>来调用java类中的静态方法,这时候我们可以用struts2的ognl标签来调用。 下面为struts2的配置文件: <struts><!-- ognl标…
5年5亿美金,华为昇腾如何构建全行业AI生态?
作者 | 阿司匹林出品 | CSDN(ID:CSDNnews)2018 年,在第三届 HUAWEI CONNECT(华为全联接大会)上,华为首次公布了 AI 战略与全栈全场景 AI 解决方案,其中包含全球首个覆盖全场景人工智能的华为昇腾…

avascript中的this与函数讲解
徐某某一个半路出家的野生程序员javascript中的this与函数讲解 前言 javascript中没有块级作用域(es6以前),javascript中作用域分为函数作用域和全局作用域。并且,大家可以认为全局作用域其实就是Window函数的函数作用域ÿ…
英特尔第11代酷睿处理器TigerLake发布,集成Xe GPU,采用10nm制程技术
2020 年 9 月 2 日,英特尔发布了下一代移动 PC 处理器,,搭载英特尔锐炬 Xe 显卡的全新第 11 代智能英特尔酷睿处理器(代号“Tiger Lake”)是全球性能领先的轻薄型笔记本处理器,能够为Windows 和 ChromeOS 系…

带闰年判断的正则表达式
作者: xixigongzhu(夕夕公主) http://search.csdn.net/Expert/topic/1974/1974227.xml?temp.6640131首先,你的年的范围是1800-3999润年:1800,1900,2100,2200,2300,2500&#x…

FTP命令解析
FTP命令是Internet用户使用最频繁的命令之一,不论是在DOS还是UNIX操作系统下使用FTP,都会遇到大量的FTP内部命令。熟悉并灵活应用FTP的内部命令,可以大大方便使用者,并收到事半功倍之效。 FTP的命令行格式为: ftp -v -…

openresty 前端开发入门五之Mysql篇
2019独角兽企业重金招聘Python工程师标准>>> openresty 前端开发入门五之Mysql篇 这章主要演示怎么通过lua连接mysql,并根据用户输入的name从mysql获取数据,并返回给用户 操作mysql主要用到了lua-resty-mysql库,代码可以在github上…

深入理解JavaScript系列(10):JavaScript核心(晋级高手必读篇)
http://www.cnblogs.com/TomXu/archive/2012/01/12/2308594.html 本篇是ECMA-262-3 in detail系列的一个概述(本人后续会翻译整理这些文章到本系列(第11-19章)。每个章节都有一个更详细的内容链接,你可以继续读一下每个章节对应的…

显示打印对话框
Montaque(Rain ManRainman) http://search.csdn.net/Expert/topic/1756/1756799.xml?temp.8004572加一个printdialog到form上,然后调用 printDialog1.ShowDialog() --------------------------------------------------------------- Dim pt As Printi…

百度CTO王海峰服贸会展示AI新基建成果,飞桨获“科技创新服务示范案例”奖
AI正在为各行各业注入新活力,而AI新基建也在为包括服务贸易领域在内的社会经济发展提供新动力。9月4日,万众瞩目的2020中国国际服务贸易交易会正式召开。这是疫情发生以来,我国在线下举办的第一场重大国际经贸活动,吸引了1.8万家境…

创建画布(验证码)
<?php //创建画布$width 500;$height 800;$imageimagecreatetruecolor($width,$height);//var_dump($image); //处理画布 //imagecolorallocate() 分配颜色到画布上,选择一个颜色。//分配颜色$greenimagecolorallocate($image,0,255,0);//填充(油漆…
认知推理下的常识知识库资源、常识测试评估与中文实践项目索引
作者 | 刘焕勇责编 | 李雪敬出品 | CSDN博客Cognitive InferenceCognitive Inference,认知推理、常识知识库、常识推理与常识推理评估的系统项目,以现有国内外已有的常识知识库为研究对象,从常识知识库资源建设和常识推理测试评估两个方面出发…

句号一定要划在句子最美的地方
句号一定要划在句子最美的地方。。。。。。。。。。。。。离职中。。。。转载于:https://blog.51cto.com/luoguoling/944357

调用系统中的默认EMAIL程序
System.Diagnostics.Process.Start("mailto:YourReceiverabcd.com?subjectWhatever&bodyWhatever")

功能点分析:商品类目表
前言作为电商网站,必然要有商品类目表,以便商品分类检索。而设计商品类目表,又是一件特别繁杂的事情。一件商品可能有多个类目来检索出来,比如苹果手机,可以从品牌检索也可以从手机检索。一个类目对应多个商品…

Iframe 用法浅析
解释成“浏览器中的浏览器“很是恰当 <iframe frameborder0 width170 height100 marginheight0 marginwidth0 scrollingno src"move-ad.htm"></iframe> <IFRAME>用于设置文本或图形的浮动图文框或容器。BORDER<IFRAME BORDER"3">…

MySQL之简单示例
Create Table1.创建数据表 CREATE TABLE amount ( id int(11) NOT NULL AUTO_INCREMENT, amount decimal(10,2) DEFAULT NULL, PRIMARY KEY (id) ) ENGINEInnoDB DEFAULT CHARSETutf8DELIMITER $$2.创建触发器示例 (1)CREATE /*[DEFINER { u…