63万张!旷视发布最大物体检测数据集Objects365 | 技术头条
编辑 | 琥珀
来源 | AI科技大本营(id:rgznai100)
昨日,在旷视科技联合北京智源人工智能研究院举办的发布会上,旷视研究院发布了物体检测数据集 Objects365,包含 63 万张图像数量,365 个类别数量,高达 1000 万的框数。旷视首席科学家兼研究院院长孙剑在活动上表示,该数据集也是新一代通用物体检测数据集,具有规模大、质量高、泛化能力强的特点。
Objects365与大型经典数据集的基本对比
相较于 COCO 数据集,Objects365 包含 63 万张图像,数量约 5 倍于COCO;包含约 1000万标注框,数量 11 倍于 COCO 数据集标注框;Objects365 每张图像的平均标注框为 15.8个,更是 2 倍以上于COCO数据集;同时还涵盖了 365 个日常物体类别。
Objects365 与 COCO/VOC 详细对比
由上图可知,即便去除其他类别而仅考虑收录于 COCO 或 VOC 数据集的 80 类和 20 类,在每张图像平均框数和类别数这两项指标上,Objects365 依然优于 COCO 和 VOC;通过分析发现,原因不仅在于数据分布的不同,还在于标注过程减少了漏标,尤其是小目标。此外,Objects365 的平均标注区域占比也超过 COCO 和 VOC。
4 类数据集中,图像包含类别数的对比
如图所示,4 个不同的数据集中,拥有不同类别数量的图像所占的比例;Objects365 的峰值是每张图相平均具有 5 个不同的类别;而其他三个数据集,大多数图像所包含的类别数量在 1-2 个。
孙剑表示,算法优化的上限严重依赖于基准数据集的质量。为保证标注质量,在打造Objects365时,旷视设计出一套科学而严格的标注流程。
Objects365 的标注图像示例
此外,Objects365预训练模型在使用过程中,可以轻松超越现有算法的精度,显著加速收敛过程,表现出极强的泛化能力。在执行COCO、VOO Det、CityPersons等检测任务时,在VOC Seg和ADE等分割任务上均有显著提升。
DIW 2019 挑战赛启动
此外,由旷视科技旷视联合北京智源人工智能研究院举办的 Detection In the Wild 2019(DIW 2019)挑战赛也发布会当天正式启动。
赛程安排:
4月10日:比赛正式开始,开放比赛队伍注册,同步发布训练集和验证集。
5月10日(23:59 PST):发布测试集数据。
6月10日(23:59 PST):测试集提交阶段结束,比赛截止。
6月17日:公布比赛结果,获胜队介绍参赛经验。
主办方为每个赛道的冠军队伍准备了10000美元的奖励。届时,优胜队将在CVPR现场的研讨会上介绍经验,共同探讨检测问题的瓶颈及优化方向。
DIW2019挑战赛的比赛赛道分为三个赛道,即Objects365赛道、Objects365小赛道和CrowdHuman赛道。
更多信息可查看:
https://www.objects365.org/workshop2019.html
智源学者计划拟公式
旷视研究员张祥雨入选
发布会上,北京智源学者计划对外进行了透露,并对首批智源学者的候选人名单进行了拟公示,共9位,分别是:
北京大学 特聘研究员 朱占星:他在深度学习的泛化性和鲁棒性方面取得了高水平成果,曾获国际计算机安全领域顶级会议CCS2018最佳论文提名。
北京大学 副研究员 章斯鑫:他建立了深度学习和小波分析的联系,论文曾发表在国际机器学习和应用数学顶级期刊上。
北京应用物理与计算数学研究所 副研究员 王涵:他在分子动力学的数值分析方面取得突出成果,在《物理评论快报(Physical Review Letters)》等国际顶级学术期刊上发表文章30余篇。
北京大学 副教授 邵嗣烘:他23岁时即获得中国计算数学学会优秀青年论文一等奖,在计算量子力学前沿做出了重要贡献。
清华大学 助理教授 林乾:他在高维数据和复杂模型的统计分析理论方面取得了高水平的研究成果,是相关领域杰出的青年学者。
清华大学 助理教授 黄高:他提出了随机深度网络、自适应推理神经网络等深度学习算法模型,曾获得2017年国际计算机视觉与模式识别会议(CVPR)最佳论文奖。
旷视科技研究院资深研究组负责人 张祥雨 博士:他是青年科学家候选人中最年轻的一位,仅28岁。多个高影响力卷积神经网络模型的主要研发者之一,曾获得2016年国际计算机视觉与模式识别会议(CVPR)最佳论文奖、国际顶级计算机视觉竞赛多项冠军。
清华大学 长聘副教授 崔鹏:他在网络表示学习和社会感知的多媒体计算方面取得一系列创新成果,获得国家自然科学二等奖一项和省部级一等奖三项,入选中组部万人计划青年拔尖人才,荣获中国计算机学会青年科学家奖和国际计算机协会中国新星奖。
清华大学 长聘副教授 唐平中:他致力于人工智能与博弈论的交叉研究,设计人工智能与优化算法,大幅度提升了互联网公司核心经济指标。
此外,发布会上,“北京智源 - 旷视智能模型设计与图像感知联合实验室”成立,该联合实验室拟由旷视研究院院长孙剑任实验室主任,研究员周舒畅任实验室副主任。
(本文为AI科技大本营整理文章,转载请联系联系 1092722531)
◆
精彩推荐
◆
推荐阅读:
售价910元!周志华等人英文新书《演化学习》出炉!
极客头条
史上第一张黑洞照片是用Python合成的?
从头构建恶性肿瘤检测网络 | 100行Python代码理解深度学习关键概念
技术头条
程序员的黑砖窑,东南亚博彩骗局详解
助力 Android 抗衡 iOS,华为发布方舟编译器!
要成为年薪百万的技术大牛必经历这5个阶段, 收好这份超实用的技术进阶指南 | 技术头条
程序员为什么都爱穿冲锋衣?(最全总结)
❤点击“阅读原文”,查看更多精彩文章。
相关文章:
(一)Android Studio 安装部署 华丽躲坑
叨叨两句先 小宇之前一直做前后端开发,只是略懂JS,未接触过Java和Android 近期工作任务也是兴趣使然,开始琢磨DJI二次开发 DJI是我最服气的无人机厂商,无人机稳定性极强,性价比狂高,还给了极度丰富的二次开…

linux 环境配置 安装jdk
一. 下载jdk5.0 for linux 到sun的主页 http://java.sun.com/j2se/1.5.0/download.jsp 下载jdk安装文件jdk-1_5_0_05-linux-i586.bin 二. 解压安装jdk 在shell终端下进入jdk-1_5_0_05-linux-i586.bin文件所在目录,执行命令 ./jdk-1_5_0_05-linux-i586.bin 这时会出现…

【C++】C++11 STL算法(六):最小/最大操作(Minimum/maximum operations)、比较运算(Comparison operations)
目录最小/最大操作(Minimum/maximum operations)一、max1、原型:2、说明:3、官方demo二、max_element1、原型:2、说明:3、官方demo三、min1、原型:2、说明:3、官方demo四、min_element1、原型:2…

springboot之定时任务
定时线程 说到定时任务,通常会想到JDK自带的定时线程来执行,定时任务。 回顾一下定时线程池。 public static ScheduledExecutorService newScheduledThreadPool(int var0) {return new ScheduledThreadPoolExecutor(var0);}public static ScheduledExec…

10只机器狗拉卡车!井然有序,毫不费力 | 极客头条
整理 | 琥珀出品 | AI科技大本营(ID:rgznai100)看来,这家娱乐网友多年的机器人公司终于要开始实现商用化了!最先备受期待的是它的网红机器狗 SpotMini。今日凌晨,据多家外媒报道,波士顿动力 (Boston Dynami…

linux下查看nginx,apache,mysql,php的编译参数
有时候nginx,apache,mysql,php编译完了想看看编译参数可以用以下方法 nginx编译参数: #/usr/local/nginx/sbin/nginx -V nginx version: nginx/0.6.32 built by gcc 4.1.2 20071124 (Red Hat 4.1.2-42) configure arguments: --us…

【C++】C++11 STL算法(七):排列操作(Permutation operations)、数值操作(Numeric operations)
排列操作(Permutation operations) 一、is_permutation 1、原型: template< class ForwardIt1, class ForwardIt2 > bool is_permutation( ForwardIt1 first1, ForwardIt1 last1, ForwardIt2 first2 );template< class ForwardIt…

码书:入门中文NLP必备干货:5分钟看懂“结巴”分词(Jieba)
导读:近年来,随着NLP技术的日益成熟,开源实现的分词工具越来越多,如Ansj、盘古分词等。在本文中,我们选取了Jieba进行介绍和案例展示,主要基于以下考虑:社区活跃。截止本文发布前,Ji…

《你必须掌握的Entity Framework 6.x与Core 2.0》正式出版感想
前言 借书正式出版之际,完整回顾下从写博客到写书整个历程,也算是对自己近三年在技术上的一个总结,整个历程可通过三个万万没想到来概括,请耐心阅读。 写博、写书完整历程回顾 从2013年12月注册博客园账号,注册博客园账…

JSF实现“Hello World!”
我们编写一个在页面上显示是“Hello World! ”,我们至少需要编写一个Page对象和一个对应模板文件(tml)。 第一步,Page对象编写 在Tapestry5中Page是与一个页面对应的POJO对象,它不需要继承Tapestry框架的任何基类或实现…

《权力的游戏》最终季上线!谁是你最喜爱的演员?这里有一份Python教程 | 附源码...
译者 | 刘畅编辑 | 琥珀出品 | AI科技大本营(id:rgznai100)《权力的游戏》最终季已于近日开播,对于全世界翘首以待的粉丝们来说,其最大的魅力就在于“无法预知的人物命运”。那些在魔幻时代的洪流中不断沉浮的人们&…

【C++】C++11 STL算法(八):对未初始化内存的操作(Operations on uninitialized memory)、C库(C library)
对未初始化内存的操作(Operations on uninitialized memory) 一、uninitialized_copy 1、原型: template< class InputIt, class ForwardIt > ForwardIt uninitialized_copy( InputIt first, InputIt last, ForwardIt d_first );2、…

OSPF高级设置实现全网互通
OSPF(开放式最短路径优先)是对链路状态路由协议的一种实现,隶属内部网关协议(IGP),故运作于自治系统内部(AS)。采用戴克斯特拉算法(Dijkstras algorithm)被用来计算最短路径树。“Cost”作为路由度量值。链…

学习PHP ?
学PHP的决定真的是好的吗? 不怕又再错一次了吗? 已经是最后的一年半上学时间了.... 真的不愿再走之前那条失败的路,不愿,真的不愿; 这年半无论如何都要把一样技术搞精了 一年半的时间,对我来讲够了....只看…

【数据库】sqlite中的限制:数据库大小、表数、列数、行数、参数个数、连接数等
目录一、参考网址二、详解1、查看、设置sqlite限制命令.limit2、SQLite中的限制汇总1)字符串或BLOB的最大长度2)最大列数3)SQL语句的最大长度4)联接中的最大表数5)表达式树的最大深度6)函数的最大参数个数7…
flutter中的生命周期
前言 和其他的视图框架比如android的Activity一样,flutter中的视图Widget也存在生命周期,生命周期的回调函数提现在了State上面。理解flutter的生命周期,对我们写出一个合理的控件至关重要。组件State的生命周期整理如下图所示: 大…

小鱼易连获腾讯数亿C轮投资,云视频布局产业互联网
4 月 18 日,小鱼易连在北京举行 “鱼腾视界 产业互联” 战略合作暨融资发布会上,正式宣布获得 C 轮融资,由腾讯领投。融得的资金将全面用于小鱼易连云视频系统在产业互联网领域的落地,打通企业、政府、个人三者之间的柔性生态全产…

异步IO一定更好吗?
http://cnodejs.org/blog/?p1015续:异步IO一定更好吗?我之前的一篇文章《异步IO一定更好吗?》中举了一个很变态的例子,用以说明在单碟机械式硬盘上异步IO反而可能降低性能的问题,大家的讨论很热烈。前天的NodeParty杭…

谈谈Python那些不为人知的冷知识(二)
本文转载自Python的编程时光(ID:Python-Time)小明在日常Code中遇到一些好玩,冷门的事情,通常都会记录下来。从上一篇的分享来看,仍然有不少 Pythoner 对这些冷知识存在盲区,所以今天迎来第二篇。如果上篇你…
前端每日实战:45# 视频演示如何用纯 CSS 创作一个菱形 loader 动画
效果预览 按下右侧的“点击预览”按钮可以在当前页面预览,点击链接可以全屏预览。 https://codepen.io/comehope/pen/eKzjqK 可交互视频教程 此视频是可以交互的,你可以随时暂停视频,编辑视频中的代码。 请用 chrome, safari, edge 打开观看。…

【数据库】SQLite和MySQL之间的对比和选择
目录1、各自特定2、使用场景3、选择哪个1、各自特定 SQLite :独立、简单(零配置);适用于为单个应用程序和设备提供本地数据存储。 MySQL:可伸缩、高并发性;适用于客户端/服务器模式企业数据的共享数据存储…

MySql中管理百万级要注意些什么东西(转载)
一、我们可以且应该优化什么? 硬件 操作系统/软件库 SQL服务器(设置和查询) 应 用编程接口(API) 应用程序 二、优化硬件 如果你需要庞大的数据库表 (>2G),你应该考虑使用64位的硬件结构,像Alpha、Sparc或即将推出的IA64。因为MySQL内部使用…

【数据库】sqlite3数据库备份、导出方法汇总
【数据库】sqlite3常用命令及SQL语句 目录1、直接拷贝数据库2、使用.backup .clone1)交互式2)脚本3、导出到csv文件中(其它格式类似)1)交互式2)脚本3)导出成其它格式汇总a> .mode asciib>…

高通与苹果宣布“复合”,英特尔黯然退场 | 极客头条
作者 | 郭芮转载自公众号CSDN(ID:CSDNnews)为期两年的苹果高通“诉讼之争”经历了各种推波助澜愈演愈烈,俨然到了最为关键的白热化阶段,没成想,在刚刚正式进入美国司法庭审环节的两天后却被强势叫停了!4 月…
MQTT 协议 Client ID 长度不能超过23个字符
今天遇到一个MQTT的问题,MqttException: MQIsdp ClientId > 23 bytes ClientId的长度大于23时,无法链接MQTT服务器。 经过查看协议发现:客户端标识符(Client ID)是介于1和23个字符长度,客户端到服务器的唯一标识。它必须在搜有客户端连接到…

【数据库】适用于SQLite的SQL语句(一)
目录一、统计函数二、表TABLE1、创建表CREATE TABLE2、更改表ALTER TABLE3、删除表DROP TABLE三、分析表ANALYZE四、附加数据库 ATTACH DATABASE五、事务六、核心函数七、索引INDEX1、创建索引:CREATE INDEX2、查看索引:3、使用索引 INDEXED BY4、删除索…

谷歌大神Jeff Dean点赞网红博士论文:改进分布式共识机制 | 技术头条
作者 | Heidi Howard编译 | 刘静本文转载自公众号图灵TOPIA(ID:turingtopia)本文作者Heidi Howard,是剑桥大学计算机科学与技术系系统研究小组的分布式系统研究员。Heidi的研究领域一直围绕分布式系统中的一致性,容错性和性能并且…

使用Nginx做前端服务器时让Apache得到真实IP的方法
一:nginx.conf proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; 其实这个proxy.conf里面默认都有,在nginx.conf使用include proxy.conf就可以 二:apa…

Hadoop生态圈-hive五种数据格式比较
Hadoop生态圈-hive五种数据格式比较 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。

华为巨资收购为云计算趟平道路?
华为巨资收购为云计算趟平道路?<?xml:namespace prefix o ns "urn:schemas-microsoft-com:office:office" />文 小刀马众所周知,华为在全球的技术能力和市场地位也是有目共睹的,这是华为多少年兢兢业业守成的一种回报。更…