当前位置: 首页 > 编程日记 > 正文

80+机器学习数据集,还不快收藏

整理 | suiling

出品 | AI科技大本营(ID:rgznai100)

对于从事机器学习的小伙伴来说,机器学习必须以大量的数据为基础,否则构建再好的模型也不能达到你想要的效果。同时,不同质量的数据集也会影响到模型训练的效果。之前营长就为大家推荐过一款机器学习数据集集合项目,如今该项目的作者已经如他所言更新内容啦!不信你看~

该项目包含了计算机视觉、自然语言处理、医疗等数据集,此外作者还很贴心地放上了每个数据集的时间、描述以及相关的Paper。

640?wx_fmt=gif

以下是该列表中的部分数据集

  • 计算机视觉数据集

640?wx_fmt=png

  • 自然语言处理数据集

640?wx_fmt=png

  • 问答数据集

640?wx_fmt=png

  • 医疗数据集

640?wx_fmt=png

更详尽的数据集列表,请见:https://www.datasetlist.com/

下边给大家推荐两个查找数据集的网站:

  • UCI machine learning repository:https://wordnet.princeton.edu/

UCI数据集是一个常用的机器学习标准测试数据集,经常出现在各种机器学习论文当中。

关于如何使用该数据集,可参考CSDN博客上的一篇文章:https://blog.csdn.net/qq_32892383/article/details/82225663

  • Kaggle datasets:https://www.kaggle.com/datasets

Kaggle,一个数据科学竞赛网站,大家都很熟悉了。

另外,营长此前也整理过一些数据集,一起分享给你。

  • 68款大规模机器学习数据集,涵盖CV、语音、NLP | 十年资源集

  • 上班时间请勿打开,158万张鉴黄图片数据集来喽~

  • 秘籍 | 机器学习数据集网址大全

  • 百度Apollo发布海量自动驾驶数据集

  • 1400小时开源语音数据集,你想要都在这儿

  • 腾讯AI Lab开源业内最大规模多标签图像数据集(附下载地址)

今日QA:什么样的数据集算是好的数据集?欢迎在评论区留言。

(*本文由 AI科技大本营整理,转载请联系微信1092722531)

精彩推荐

「2019 Python开发者日」精彩日程全揭晓~这一次我们依然“只讲技术,拒绝空谈”10余位一线Python技术专家共同打造一场硬核技术大会。更有深度培训实操环节,为开发者们带来更多深度实战机会。更多详细信息请咨询13581782348(微信同号)。

相关文章:

SpringBoot+Docker+Git+Jenkins实现简易的持续集成和持续部署

前言 本篇文章引导你使用Jenkins部署[SpringBoot项目],同时使用Docker和Git实现简单的持续集成和持续部署。(项目地址:sso-merryyou) 流程图如下: push代码到Github触发WebHook。(因网络原因,本篇使用gitee…

LINUX下用C语言历遍目录 C语言列出目录

&#xff08;被考了一题遍历目录&#xff0c;连需要的系统库函数我都不知道...打击中...&#xff09;小羽给了一个答案&#xff1a;#include<stdio.h> #include<dirent.h>int main(int argc,char **argv) { DIR *p; struct dirent *dirp; if (argc ! 2) …

【linux】ubuntu14.04升级dbus到1.13.8,杯具了,无法进入桌面

一、问题描述 在ubuntu14.04中安装了Qt5.12&#xff0c;启动QtCreator报错&#xff0c;需要高版本的dbus。 将dbus升级到1.13.8后&#xff0c;杯具了&#xff0c;无法进入桌面 二、尝试解决 1、尝试恢复之前的版本&#xff08;失败&#xff09; 进入终端界面&#xff1a;Ct…

线下教育地位遭冲击?“AI+教育”公司同台讲了这些事实

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」7折优惠最后1天&#xff0c;请扫码咨询 ↑↑↑整理 | 一一出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;近日&#xff0c;网易新闻、网易有道、清华大学数据科学研究院在清华大学举办了“中国AI创新者论坛”。当…

mysql查看正在执行的sql语句

有2个方法&#xff1a; 1、使用processlist&#xff0c;但是有个弊端&#xff0c;就是只能查看正在执行的sql语句&#xff0c;对应历史记录&#xff0c;查看不到。好处是不用设置&#xff0c;不会保存。 -- use information_schema; -- show processlist; 或者&#xff1a; -- …

poj2472

最短路&#xff0c;bellman View Code #include <iostream>#include <cstdio>#include <cstdlib>#include <cstring>#include <cmath>using namespace std;#define inf 0x3f3f3f3f#define maxn 100#define maxm 10000#define eps 10e-9int n, m…

.net core 2.0 部署到centos 7生产环境

.netcore的跨平台如此之火&#xff0c;忍不住想试试 在linux下部署 .net 程序。 借鉴此篇博文&#xff1a;将ASP.NET Core应用程序部署至生产环境中&#xff08;CentOS7&#xff09; 虽然是借鉴&#xff0c;但过程坎坷。对从未使用过linux的我难度可想而知&#xff0c;但万事有…

微软沈向洋:写给AI新潮流——人工智能创作的五点建议

2019年EmTech 数字大会 本周&#xff0c;我有幸在旧金山举行的EmTech数字大会上发言&#xff0c;为大家讲述了当今人工智能发展的现状&#xff0c;以及未来的发展方向。我想与大家分享的是&#xff0c;面对新一轮的人工智能创新大潮&#xff0c;人们最该思考的五件大事。 1)技…

【Linux】在VirtualBox-6.0中安装Manjaro18.0

1、参考博客&#xff1a; VMware虚拟机下Manjaro17.1.6安装详细教程 2、在VirtualBox-6.0中安装Manjaro18.0 1&#xff09;基本步骤和博客中安装17.1.6相同&#xff0c;下面只记录不同的。 * VirtualBox中没有Manjaro的选项&#xff0c;可以选择 ArchLinux&#xff1b; * 本…

netty里集成spring注入mysq连接池(一)

netty的性能非常高&#xff0c;能达到8000rps以上&#xff0c;见 各个web服务器的性能对比测试 1.准备好需要的jar包 spring.jar //spring包 netty-3.2.4.Final.jar // netty库 commons-dbcp.jar // dbcp数据库连接池 mysql-connector-java-5.1.6.jar // d…

图很难理解?看这篇图论基础与图存储结构就够了

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」&#xff0c;购票请扫码咨询 ↑↑↑作者 | 程序员吴师兄转载自五分钟学算法&#xff08;ID:CXYxiaowu&#xff09;1 前言打算先普及一下图的相关理论支持&#xff0c;本文不建议一口气阅读完毕&#xff0c;可以先浏览一遍&a…

【Linux】修改/etc/fstab时参数设错,导致启动异常,无法进入系统(已解决)

1、问题描述 在ubuntu14.04上设置自动挂载硬盘分区时&#xff0c;修改/etc/fstab时&#xff0c;将defaults错误写成default&#xff0c;导致启动异常&#xff0c;无法进入系统。 2、解决方法 1&#xff09;ubuntu启动时有两种模式&#xff1a;普通模式&#xff08;ubuntu&am…

gitlab安装

根据官方文档安装&#xff1a;https://www.gitlab.com.cn/installation/#centos-6 centos6&#xff1a; 1、没有安装lokkit&#xff0c;yum search lokkit后安装lokkit sudo yum install -y curl policycoreutils-python openssh-server cronie sudo lokkit -s http -s ssh2、安…

如何将Android带入互联网数字家庭? 第一篇转载

前言&#xff1a;很有幸通过ARM Group认识了 ARM的家庭软件架构师 --- 章立(Leon Zhang) &#xff08;他也是ARM战略软件联盟部门的一员. Leon 拥有多年产品开发和项目管理经验&#xff0c; 曾经参与了数字录像机、机顶盒、数字电视&#xff0c;网络电视以及智能电视&#xff0…

【linux】用过的shell命令

1、批量替换文件中的字符串 eg&#xff1a;将当前目录 . 下的old替换成new sed -i "s/new/old/g" grep old -rl .如果字符串中有‘/’等特殊字符需要反斜杠‘\’来转移 eg&#xff1a;将当前目录下的“old/old”&#xff0c;替换成“new/new” sed -i "s/new…

node简单实现excel文件下载

1.利用csv格式兼容实现 csv是一种利用,、\t、\n等分隔符存储的文本文件&#xff0c;excel可兼容打开&#xff0c;利用此原理&#xff0c;代码实现如下&#xff1a; app.use(route.get(/export, async ctx > {ctx.res.setHeader(Content-Type, application/vnd.ms-execl);ctx…

儿科医生的眼泪,全被数据看见了

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」&#xff0c;购票请扫码咨询 ↑↑↑作者 | AlfredWu来源 | Alfred数据室&#xff08;ID:Alfred_Lab&#xff09;《人间世》第二季第8集《儿科医生&#xff1a;坚守&#xff0c;还是逃离&#xff1f;》把儿科医生的辛苦与挣扎…

[毕业生的商业软件开发之路]C#类型样式

近期开始接触到在校学生、高校实习生和毕业生&#xff0c;在此说一下笔者对这些徘徊在职场门口的学生一些建议,希望能给这些初学者进入软件开发行业带来一些帮助,使得毕业生能更顺利的进入软件开发公司开始职场生涯&#xff0c;人生来一个完美的转弯。 -----------------------…

特斯拉被曝储存大量未加密个人数据 | 极客头条

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」&#xff0c;购票请扫码咨询 ↑↑↑编译丨王哲来源丨猎云网&#xff08; ID&#xff1a;ilieyun&#xff09;编者按&#xff1a;特斯拉是否明确界定了数据安全的目标&#xff1f;它现有的规则又在保护哪些人&#xff1f;如果…

【Linux】neocomplcache disabled: “sudo vim“ is detected and $HOME is set to your user‘s home

1、问题描述 使用sudo vim时&#xff0c;弹出提示&#xff1a; neocomplcache disabled: "sudo vim" is detected and $HOME is set to your users home. You may want to use the sudo.vim plugin, the "-H" option with "sudo" or set alwa…

016 | 漫谈区块链共识机制

原创文章&#xff0c;转载请注明&#xff1a;转载自Keegan小钢 并标明原文链接&#xff1a;http://keeganlee.me/post/blockchain/20180425 微信订阅号&#xff1a;keeganlee_me 写于2018-04-25 专栏地址&#xff1a;xiaozhuanlan.com/fullstack 共识机制是区块链的一个核心特征…

临危不乱,.Net+IIS环境经常出现的问题及排障。

http://www.cnblogs.com/CoreCaiNiao/archive/2011/08/02/2123991.html

零门槛!手把手教你打造AI应用

如你所见&#xff0c;聊天机器人已经逐渐渗透到生活的方方面面。它可以提供生活娱乐方面的服务&#xff0c;比如查询音乐、地图、天气&#xff0c;做心理测试&#xff0c;甚至 Google 的 Duplex 技术还能让你通过机器人进行订餐&#xff0c;当然还有很多能跟你谈天说地闲聊胡扯…

【Qt】启动QtCreator时报错:Cannot mix incompatible Qt library (version ) with this library (version...

1、问题描述 当启动QtCreator时报错(我的Qt版本是Qt5.6.3): Cannot mix incompatible Qt library (version 0x50603) with this library (version 0x50601) Aborted (core dumped)2、原因分析 原因是QtCreator使用的Qt库版本是5.6.1,而环境中配置的Qt库版本是5.6.3 1)Q…

利用IIS作为宿主 发布你的WCF Service(转)

http://blog.csdn.net/blacksource/article/details/3942130最近公司的一个需求&#xff0c;涉及到WCF开发。在网上找了些资料&#xff0c;大都是利用单独的应用程序、或者Windows服务作为WCF Service的host。其实WCF还提供一种方式&#xff0c;和以前的Remoting比较类似&#…

旷视提出AutoML新方法,在ImageNet取得新突破 | 技术头条

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」&#xff0c;购票请扫码咨询 ↑↑↑来源 | 旷视研究院 近日&#xff0c;来自旷视研究院的郭梓超、张祥雨、穆皓远、孙剑等人发表一篇新论文“Single Path One-Shot Neural Architecture Search with Uniform Sampling”&a…

9.QT-标准对话框

Qt提供的可复用的标准对话框,全部继承自QDialog类,如下图所示: QMessageBox&#xff1a;信息对话框&#xff0c;用于显示信息、询问问题等&#xff1b;QFileDialog&#xff1a;文件对话框QColorDialog&#xff1a;颜色对话框QInputDialog&#xff1a;输入对话框(允许用户输入一…

【Python】解决print不能立即打印的问题

1、问题描述 在Python中使用print打印hello world时&#xff0c;终端不显示 def hello():print("hello world!")2、原因 因为标准输入输出stdin/stdout有缓冲区&#xff0c;所以使用print不能立即打印出来&#xff0c;作为刚接触Python的菜鸟&#xff0c;迷瞪了半…

windows mobile做一个摄象头预览程序

zdirectshow的原理大概大家都知道,基本就是用微软封装的接口来实现硬件无关性,但是最终调用的接口都要在驱动层有对应的实现: 为了更清楚地演示directshow的数据传输过程,我必须说明的这个程序的基本流程。我采用的是vs2005 windows mobile 6。0 professional 仿真模拟器&…

初学者的机器学习入门实战教程!

点击上方↑↑↑蓝字关注我们~「2019 Python开发者日」&#xff0c;购票请扫码咨询 ↑↑↑作者 | Adrian Rosebrock译者 | kbsc13&#xff0c;京东算法工程师&#xff0c;研究领域计算机视觉来源 | 机器学习与计算机视觉&#xff08;ID&#xff1a;AI_Developer&#xff09;这是…