当前位置: 首页 > 编程日记 > 正文

机器学习和计算机视觉的前20个图像数据集

作者 | Meiryum Ali 

翻译 | 火火酱,责编 | 晋兆雨

出品 | AI科技大本营

头图 | 付费下载于视觉中国

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类视觉系统可以实现任务自动化。

计算机视觉任务包括图像采集、图像处理和图像分析。图像数据可以采用不同的形式,例如视频序列,从多个角度的不同的摄像机查看图像或来自医疗扫描仪的多维数据。

用于计算机视觉训练的图像数据集

Labelme:麻省理工学院计算机科学与人工智能实验室(CSAIL)创建的大型数据集,包含187,240张图像、62,197条带注释的图像和658,992张带标签的对象。

乐高积木:通过文件夹和使用Blender渲染的计算机对大约16700种乐高积木进行分类的大约12,700张图像。

ImageNet:用于新算法的实际图像数据集。根据WordNet层次结构进行组织,其中层次结构的每个节点都以成千上万的图像进行描绘。

LSUN:具有许多辅助任务的场景理解(房间布局估计、显着性预测等)

MS COCO:COCO是包含200,000多个标记图像的大规模对象检测、分割和字幕数据集。它可以用于对象分割,上下文识别以及许多其他用例。

哥伦比亚大学图像库:COIL100是一个数据集,其中包含360个旋转角度中每个角度成像的100个不同对象。

视觉基因组:视觉基因组是一个数据集和知识库,旨在将结构化图像概念与语言联系起来。该数据库具有详细的视觉知识库,并带有108,077张图像的字幕。

Google的开放图像:“Creative Commons”下900万个URL的图像集合,这些URL已用6000多个类别的标签进行了注释。

来自“打开图像”数据集的带注释的图像。

左:Kevin Krejci的《鬼拱门》。右:J B制造的银制厨房用具。两个图像均在CC BY 2.0许可下使用。

Youtube-8M:带有标签的大规模数据集,由数百万个YouTube视频ID组成,带有超过3,800多个视觉实体的注释。

带标签的野外面孔:13,000个带标签的人脸图像,用于开发涉及面部识别的应用程序。

斯坦福犬类数据集:包含20,580张图像和120种不同的犬种类别,每个类别约有150张图像。

地点:以场景为中心的数据库,其中包含205个场景类别和250万个带有类别标签的图像。

CelebFaces:具有超过200,000张名人图像的人脸数据集,每个图像带有40个属性注释。

来自CelebFaces数据集的样本图像。

花卉:在英国常见的花朵图像数据集,包含102个不同类别。每个花类由40至258张图像组成,这些图像具有不同的姿势和光线变化。

植物图像分析:涵盖超过一百万张植物图像的数据集。可以从11种植物中选择。

家庭对象:一个数据集,其中包含来自家庭的随机对象,大部分来自厨房、浴室和客厅,这些对象分为训练和测试数据集。

CIFAR-10:包含60,000张32×32彩色图像的大型图像数据集,分为10类。数据集分为五个训练批次和一个测试批次,每个批次包含10,000张图像。

CompCars:包含163种车型,包含1,716种车型,每种车型都标有五个属性,包括最大速度、排量、门数、座位数和汽车类型。

室内场景识别:非常具体的数据集,非常有用,因为大多数场景识别模型在“外部”效果更好。包含67个室内类别,共15620张图像。

VisualQA:VQA是一个数据集,包含有关265,016张图像的开放式问题。这些问题需要对视觉和语言的理解。对于每个图像,至少有3个问题,每个问题10个答案。

*本文仅代表作者个人观点,不代表AI科技大本营任何立场。

原文链接:

https://hackernoon.com/top-20-image-datasets-for-machine-learning-and-computer-vision-rq3w3zxo

本文由AI科技大本营翻译,转载请注明出处

更多精彩推荐
  • 为什么苹果M1芯片这么快?

  • 仅剩一周!!CSDN年终大放血!人人有份的大奖你确定不来?

  • GitHub 超 20000 Star,最火开源视频库 FFmpeg 这 20 年!

  • 都 2021 年了,Serverless 能取代微服务吗?

  • 2020年中国AI算力报告发布:超大算法模型挑战之下,公共AI算力基建是关键

相关文章:

移动应用开发者应该关注的 Google I/O 两项更新

移动应用开发者看过来,今年 Google I/O 这两项更新能帮上大忙移动应用开发者看过来,今年 Google I/O 这两项更新能帮上大忙。 I/O 的 Keynote 刚刚结束,用户可能为 Google 新的消费产品感到兴奋。但这毕竟是开发者大会,一些面向开…

赠书 | 手把手教你自己动手打造一个智能恒温器

作者 | Yazeed Sabri翻译 | 火火酱,责编 | 晋兆雨出品 | AI科技大本营头图 | 付费下载于视觉中国*文末有赠书福利为了能住得离公司近一点,我就搬进了一套没有温控系统的公寓。因为在芝加哥市区,这个价位的公寓大多都是没有温控系统的,所以我心…

JVM 出了问题 EXCEPTION_ACCESS_VIOLATION

2019独角兽企业重金招聘Python工程师标准>>> # # An unexpected error has been detected by Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc0x10002c08, pid5972, tid1404 # # Java VM: Java HotSpot(TM) Client VM (11.3-b02 mixe…

转换字符串中汉字为其拼音缩写(C#)

//将指定字符串中的汉字转换为拼音缩写,其中非汉字保留为原字符。 public string GetPinYin( string text){char pinyin;byte[] array;System.Text.StringBuilder sb new System.Text.StringBuilder(text.Length); foreach(char c in text) { pinyin c; …

weblogic线程阻塞性能调优(图解)

转自:http://blog.csdn.net/z69183787/article/details/12647539 声明:出现这个问题有程序方面、网络方面、weblogic设置方面等等原因,此文章主要讲述由于weblogic设置而导致的解决办法。 因为: 1.程序问题,需要项目自…

ASP.net实现无扩展名的URL重写。简单、方便、无需ISAPI

URL重写已经有很多的方法,但是多数都有一个缺点,就是不支持无扩展名的网页。微软提供的方法需要在根目录里面建立jyk的文件夹,然后再建立一个default.aspx的文件,如果您有100名会员的话,这是一个不可想象的事情。 另一…

IDC公布中国深度学习市场综合份额:百度超越Facebook位列第二

近日,权威数据调研机构IDC公布了2020年下半年深度学习框架平台市场份额报告。数据显示,在中国深度学习平台市场综合份额中,Google、百度、Facebook稳居前三,占据70%以上市场份额。其中,百度占比提升3.38%增速第一&…

OpenStack 和 Cloud Foundry

上周我参加了在亚特兰大举行的OpenStack峰会,这是一个非常好的机会去进一步了解Cloud Foundry 和OpenStack ecosystem之间的关系。 在OpenStack阵营里,在讨论PaaS时,“Could Foundry 是不是 OpenStack” ,这个看起来像是一个有争议…

防止IIS文件被下载方法

如何才能防止encry目录下的所有文件被非法下载呢?我们可以应用IIS中的应用程序映射结合ASP.NET中的IHttpHandler自定义权限,把IIS应用程序映射用于所有文件,并将控制权交给我们自己实现的IHttpHandler。 首先添加应用程序映射:打…

转 如何在IOS设备中去掉屏幕上的status bar

引入如何在IOS设备中去掉屏幕上的status bar,即:不显示设备上方的[网络、时间、电池??]条?操作方法一:在-info.list项目文件中,加上“Status bar is initially hidden”选项,并勾选…

倒计时7天!博客之星虚位以待,Macbook等你来拿

也许你陪伴了CSDN一年的时间刚刚写下自己的第二十篇的原创技术博文也许你是陪伴了CSDN近20年风雨的老码农更新了近千百篇的技术文章也许你还在坚持着“技术输出”也许你已经开始封笔也许你刚刚突破粉丝数达到了三位,四位数也许你刚刚申请的博客专家,终于…

UVA 10515 - Powers Et Al.(数论)

UVA 10515 - Powers Et Al. 题目链接 题意:求出m^n最后一位数 思路:因为m和n都非常大,直接算肯定是不行的,非常easy想到取最后一位来算,然后又非常easy想到最后一位不断乘自身肯定会形成周期。而且这个周期还挺短的&am…

视觉+Transformer最新论文出炉,华为联合北大、悉尼大学发表

作者 | CV君来源 | 我爱计算机视觉Transformer 技术最开始起源于自然语言处理领域,但今年5月份Facebook 的一篇文章将其应用于计算机视觉中的目标检测(DETR算法,目前已有78次引用)使其大放异彩,并迅速得到CV研究社区的关注。已有研究表明&…

易宝典文章——怎样管理Exchange Server 2013邮箱地址

对于一个用户邮箱,即邮箱收件人来讲,在创建时Exchange会为其按照Alias分配一个邮件地址,即主邮件地址,也称为“主SMTP地址”或“默认答复地址”。但是在用户日常使用中可能会出现需要多个邮件地址的情况,比如&#xff…

使用FileUpload控件上传图片并自动生成缩略图、自动生成带文字和图片的水印图

本文借助vs2005中自带的FileUpload控件实现图片文件的上传并生成缩略图。实现过程:选择图片上传成功后,取得已经存在服务器的文件生成缩略图,并且判断是否是图片类型的文件,这个的判断可以在程序中修改,本程序只是判断…

Java -- JDBC 学习--通过Statement进行数据库更新操作

通过 JDBC 向指定的数据表中插入一条记录. 1. Statement: 用于执行 SQL 语句的对象 1). 通过 Connection 的 createStatement() 方法来获取 2). 通过 executeUpdate(sql) 可以执行 SQL 语句. 3). 传入的 SQL 可以是 INSRET, UPDATE 或 DELETE. 但不能是 SELECT 2.…

身份证号码验证-支持新的带x身份证

//--身份证号码验证-支持新的带x身份证functionisIdCardNo(num) { varfactorArr newArray(7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2,1); varerror; varvarArray newArray(); varintValue; varlngProduct 0; varintCheckDigit; varintStrLen num.length; v…

装上后这 14 个插件后,PyCharm 真的是无敌的存在

来源 | Python编程时光作者 | 写代码的明哥Key Promoter X如果让我给新手推荐一个 PyCharm 必装插件,那一定是 Key Promoter X 。它就相当于一个快捷键管理大师,它时刻地在:教导你,当下你的这个操作,应该使用哪个快捷…

批量实现面向对象的实例

<!DOCTYPE html> <html> <head> <meta charset"utf-8"> <title>批量实现面向对象的实例</title> <script type"text/javascript"> window.onload function(){function Person(name,age){this.name name;this.…

读Zepto源码之操作DOM

2019独角兽企业重金招聘Python工程师标准>>> 这篇依然是跟 dom 相关的方法&#xff0c;侧重点是操作 dom 的方法。 读Zepto源码系列文章已经放到了github上&#xff0c;欢迎star: reading-zepto 源码版本 本文阅读的源码为 zepto1.2.0 .remove() remove: function()…

VSS的每日自动备份

小弟在项目中兼职担当配置管理员&#xff0c;备份VSS的重任当然也得我来扛着&#xff0c;不然兄弟们加班加点的劳动果实可能因为什么天灾人祸一不小心就挂了。以往备份VSS的频率是一月一次&#xff0c;近来受到上面的教导&#xff0c;备份频率较少&#xff0c;需要每日备份。难…

当 AI 闯入法律界,第一步是当律师的得力助手

来源 | HyperAI超神经责编 | 晋兆雨头图 | CSDN 下载自视觉中国长久以来&#xff0c;律师这一职业给大众的印象都是精英、雄辩、高薪&#xff0c;而这份工作背后的艰辛却很少被看到。除了出庭之外&#xff0c;律师们要花费大量时间与经历进行法律资料研究、合同文件审查等。为此…

Ubuntu下添加新分区并设置挂载点

Ubuntu下添加新分区并设置挂载点最近在做Android项目&#xff0c;可是解压根文件系统以后&#xff0c;就报警说硬盘不够。当初设置使用的大小为15G。不过扩展分区还是很方便的。当然首先你得设置添加使用的硬盘大小&#xff0c;这次我一下提高到了30G&#xff0c;看它还报警否。…

2016 只剩最后一个月 你的 技术债务 还清了吗?

一夜醒来&#xff0c;猛然发现&#xff0c;2016 已经只剩最后一个月了&#xff01; 回忆过去的 330 多个日与夜&#xff0c;哪些互联网圈的大事让你瞠目结舌&#xff1f; 也许是 AlphaGo 在堪称人脑游戏巅峰的围棋领域屡战告捷&#xff1b; 也许是 Pokmon Go 称霸大洋彼岸&…

给图片加上带版权的水印

我们在网站上有些时候需要给图片加上带版权的水印&#xff0c;.net的Graphics类可以很轻松的实现这一点。效果图&#xff1a;&#xff08;图片最上端的那行字便是我们加上的版权水印了&#xff09;实现代码&#xff1a; /**//// <summary> /// 生成带版权水印的图片 …

重磅推出开发者计划、App Store,赛灵思普及自适应计算的一大步

得开发者得天下。尤其随着AI技术落地趋势加剧&#xff0c;其中大部分创新来自软件应用&#xff0c;市场对软件开发者有着极大需求。因此&#xff0c;无论是互联网公司还是传统的IT厂商都在尝试将开发者沉淀到自己的平台。 作为FPGA的开创者&#xff0c;赛灵思正在突破主要支持硬…

Web 开发人员必备的随机 JSON 数据生成工具

在 Web 开发中&#xff0c;经常会需要一些测试数据来测试接口或者功能时候正确。JSON Generator 就是这样一款生成随机 JSON 数据的在线工具&#xff0c;Web 开发人员必备&#xff0c;记得收藏和分享啊。 您可能感兴趣的相关文章Verlet-js&#xff1a;超炫的开源 JavaScript 物…

bootstrap解析-栅格系统

.container(布局容器) 屏幕宽1200px以上&#xff08;col-lg&#xff09; 1. 默认width为1170px 2. padding,lefet和right各为15px,所以内容width为1140px;屏幕宽992px以上(col-md) 1. 默认width为970px 2. padding,lefet和right各为15px,所以内容width为940px;屏幕宽768px以上(…

asp.net中窗口相关操作总结(javascript)

1.打开新窗口 这个简单:Response.Write("<script language javascript>window.open(url);</script>"); 2.关闭窗口 //关闭当前窗口,并提示用户时候关闭,yes关闭,no退出 Response.Write("<script language javascript>window.close();</sc…

200万注册开发者,13亿张全景图片,90%数据生产环节AI化,百度地图生态全景升级2.0

12月29日&#xff0c; 2020百度地图生态大会在京举办。据介绍&#xff0c;在AI技术加持下&#xff0c;百度地图实现了90%数据生产环节AI化&#xff0c;全新升级生态全景2.0。 百度集团副总裁、百度集团首席信息官(CIO)李莹出席大会并致辞&#xff0c;她表示&#xff1a;“在20…