挑战弱监督学习的三大热门问题 AutoWSL2019挑战赛正式开赛
AutoWSL2019作为11月17-19日亚洲机器学习大会(ACML)主会议竞赛单元之一,由第四范式、ChaLearn、RIKEN和微软联合举办,其中竞赛分享和颁奖将与大会WSL-Workshop共同举办。据悉,AutoWSL是继AutoCV、AutoCV2、AutoNLP、AutoSpeech之后的第5届自动深度学习(AutoDL)挑战赛,比赛已于9月24日正式开始。本次挑战赛聚焦于弱监督学习相关任务的自动化解决方案,参赛者需要设计自动机器学习程序完成半监督学习、正例及未标记学习和噪声标记学习三个热门方向任务,解决不同应用领域的二分类问题。
竞赛官网:https://www.4paradigm.com/competition/autowsl2019
现代机器学习正在向复杂模型(如深度神经网络)的时代迁移,而复杂模型需要大量的优质标注数据。大公司有足够的资源来收集优质的标注数据,然而对于初创公司或非营利组织来说,标记数据的高昂成本只能让他们望而却步。此外,在特定领域的数据存在自然稀缺性(如阿尔茨海默病或地震预测等),优质的标注数据可能根本不存在。弱监督学习(WSL)方法试图通过访问比监督学习更少的标注信息,来达到监督学习相近的效果目标。正因为WSL不需要大量的标注数据,促使大家对弱监督学习进行研究和关注,以期望让更多的用户和企业享受低门槛的机器学习红利。但传统的弱监督学习方法有太多的超参数需要根据问题进行调整,需要付出众多人力才能成功部署弱监督学习方法,而我们希望召集来自全球各地的优秀参赛者一起通过自动化解决方法破解这一难题,降低弱监督学习方法的使用门槛。
本次赛事主要负责人、第四范式主任科学家涂威威表示:第四范式接触到的现实业务中有非常多的弱监督学习场景,有效的自动弱监督学习方法对于规模化解决这些场景中的机器学习问题至关重要。第四范式联合南京大学提出了自动半监督学习(AutoSSL)以及自动正例及未标记学习(AutoPU)等方法。但是相关的研究才刚刚起步,举办本次比赛也是希望吸引更多优秀的研究人员和从业人员关注到自动化弱监督学习的问题,一起推动这个领域的技术进步,从而帮助更多的行业利用机器学习技术提升效益。
关于比赛
本次比赛是国际首届自动弱监督学习竞赛,旨在为与弱监督学习相关的任务提供自动化的解决方案,挑战任务仅限于来自不同应用领域的二分类问题。大会为参赛者提供3个练习数据集,用于开发自动弱监督学习程序。随后,该程序将在无人工干预的情况下在18个私有验证数据集上进行反馈测试,选手可以通过验证数据集上的反馈结果调整程序;最后在18个私有测试数据集上进行测试评估,测试结果将决定最终的竞赛排名。
在AutoWSL竞赛中,我们将重点关注弱监督学习中的三个热门任务,即半监督学习(有些样本是未标记的)、正例及未标记学习(样本只有正例或未标记,没有负例)和从噪声标记中学习(所有样本都有标记,但有些标记可能是错误的)。这三个任务互不关联,不会同时出现在同一个数据集中。另外,组委会提供辅助信息帮助参赛者确定他们需要在每个数据集上执行的任务。
赛事挑战
AutoWSL将对参赛者提出新的挑战,如下所列:
-如何自动处理各种弱监督学习任务?
-如何为不同的任务自动提取有用的特征?
-如何自动处理不同数量的监督信息?
-如何自动设计有效的学习模型来处理各种结构化数据?
此外,参赛者还应考虑:
-如何自动和有效地选择适当的超参数?
-如何提高解决方案通用性?即如何保证解决其在未知任务中的适用性?
-如何控制计算和内存成本?
平台介绍
参赛者须登入我们的竞赛平台开始挑战,请依照平台「开始挑战」中的指示,以获得数据、了解数据格式及提交界面,并下载Starting Kit。
本次比赛准备了总共39个分类数据集,参赛者首先下载三个可以下载的练习数据集,以便他们可以离线开发他们的自动弱监督解决方案。此外,另外18个验证数据集也提供给参与者,以评估其解决方案的公共排行榜分数。之后,他们的解决方案将在没有人工干预的情况下用18个私有测试数据集盲测评估。
数据集
这一挑战仅限于来自不同应用领域的二分类问题,竞赛将重点关注WSL中的三个热门任务,即半监督学习(部分样本未标记)、正例及未标记学习(样本只有正例或未标记样本,没有负例)和从噪声标签中学习(所有样本都有标记,但部分标签可能是错误的),这三个不相交的任务不会同时出现在单个数据集中。
竞赛规则
这项挑战分为三个阶段。首先,参赛者将获得可以下载的练习数据集,以便可以离线开发他们的AutoWSL程序;然后进入反馈阶段,参赛者将AutoWSL代码上传到竞赛平台上,程序将在18个验证数据集中测试,并得到其方法性能的即时反馈。反馈阶段结束后,竞赛进入检查阶段,参与者只允许在私有数据集上提交一次代码以进行调试,该阶段参赛者无法读取阅读详细的日志,但可以查看代码是否报告错误。最后进入最终阶段,参赛者提交的程序将在18个私有测试数据集上进行评估。最终阶段的排名将决定获胜者。
提交的程序代码是自动训练和测试的,无需任何人工干预。在反馈阶段提交的代码在所有18个反馈数据集上并行地运行在单独的计算机上,每个数据集都有测试时间限制。
平台上用于测试的数据集的所有信息将被隐藏,数据将以原始形式提供(没有特征提取),以鼓励研究人员进行自动特征学习,所有问题都是二分类问题,任务完成受时间限制。
有关提交和评估的更多详细信息,请访问平台。
点击了解更详细比赛规则。
赛事时间:
北京时间(UTC+8)
2019年9月24日23:59:反馈阶段开始,练习数据集的发布。参赛者可以开始提交代码并在排行榜中获得即时反馈。
2019年10月22日23:59:参赛者真实身份验证。
2019年10月29日23:59:反馈阶段结束。
2019年10月30日00:00:检查阶段开始。
2019年11月2日19:59:检查阶段结束。
2019年11月2日20:00:最终阶段开始。
2019年11月4日20:00:重新提交截止日期。
2019年11月6日20:00:最终阶段结束。
请注意,CODALAB平台使用UTC时间格式,请注意比赛官网其他地方的时间说明,以免错过比赛各阶段的时间点。
赛事奖励:
第一名:$2000
第二名:$1500
第三名:$500
关于AutoML
- First AutoML Challenge
- AutoML@PAKDD2018
- AutoML@NeurIPS2018
- AutoML@PAKDD2019
- AutoML@KDDCUP2019
- AutoCV@IJCNN2019
- AutoCV2@ECML PKDD2019
- AutoNLP@WAIC2019
- AutoSpeech@ACML 2019
相关文章:

数据连接池的工作机制是什么?
以典型的数据库连接池为例: 首先普通的数据库访问是这样的:程序和数据库建立连接,发送数据操作的指令,完成后断开连接。等下一次请求的时候重复这个过程,即每个请求都需要和数据库建立连接和断开连接,这样当…

apkplug插件托管服务简化与简介-05
2019独角兽企业重金招聘Python工程师标准>>> 本文基于TuoClondService1.1.0讲解 apkplug插件托管服务是提供给开发者一个远程发布插件的管理平台,但v1.0.0版本接口调用有些复杂我们在v1.1.0版本中着重对其进行了简化 与封装,使开发者能更简…

SpringBoot-JPA入门
SpringBoot-JPA入门 JPA就是Spring集成了hibernate感觉。 注解,方法仓库(顾名思义的方法,封装好了,还有自定义的方法)。 案例: spring:datasource:url: jdbc:mysql://localhost:3306/springboot?useUnicodetrue&c…

PCA、LDA、MDS、LLE、TSNE等降维算法的Python实现
整理 | 夕颜出品 | AI科技大本营(ID:rgznai100)【导读】网上关于各种降维算法的资料参差不齐,但大部分不提供源代码。近日,有人在 GitHub 上整理了一些经典降维算法的 Demo(Python)集合,同时给出了参考资料的链接。PCA…

C++11中enum class的使用
枚举类型(enumeration)使我们可以将一组整型常量组织在一起。和类一样,每个枚举类型定义了一种新的类型。枚举属于字面值常量类型。 C包含两种枚举:限定作用域的和不限定作用域的。这里主要介绍限定作用域的。不限定作用域的使用可以参考: ht…

Windows下Mysql主从配置(Mysql5.5)
主数据库IP:192.168.3.169从数据库IP:192.168.3.34主数据库配置my.inin:在[mysqld]下添加配置数据:server-id1 #配一个唯一的ID编号,1至32。log-binmysql-bin #二进制文件存放路径#设置要进行或不要进行主从复制的数据库名,同…
K-最近邻法(KNN) C++实现
关于KNN的介绍可以参考: http://blog.csdn.net/fengbingchun/article/details/78464169 这里给出KNN的C实现,用于分类。训练数据和测试数据均来自MNIST,关于MNIST的介绍可以参考: http://blog.csdn.net/fengbingchun/article/deta…

AI大佬“互怼”:Bengio和Gary Marcus隔空对谈深度学习发展现状
编译 | AI科技大本营编辑部出品 | AI科技大本营(ID:rgznai100)去年以来,由于纽约大学教授 Gary Marcus 对深度学习批评,导致他在社交媒体上与许多知名的 AI 研究人员如 Facebook 首席 AI 科学家 Yann LeCun 进行了一场论战。不止 …

Centos7多内核情况下修改默认启动内核方法
1.1 进入grub.cfg配置文件存放目录/boot/grub2/并备份grub.cfg配置文件 [rootlinux-node1 ~]# cd /boot/grub2/ [rootlinux-node1 grub2]# cp -p grub.cfg grub.cfg.bak [rootlinux-node1 grub2]# ls -ld grub.cfg* -rw-r--r--. 1 root root 5162 Aug 11 2018 grub.cfg -rw-r…
TensorRT Samples: MNIST
关于TensorRT的介绍可以参考: http://blog.csdn.net/fengbingchun/article/details/78469551以下是参考TensorRT 2.1.2中的sampleMNIST.cpp文件改写的实现对手写数字0-9识别的测试代码,各个文件内容如下:common.hpp:#ifndef FBC_TENSORRT_TE…

网红“AI大佬”被爆论文剽窃,Jeff Dean都看不下去了
作者 | 夕颜、Just出品 | AI科技大本营(ID:rgznai100)【导读】近日,推特上一篇揭露 YouTube 网红老师 Siraj Raval 新发表论文涉抄袭其他学者的帖子引起了讨论。揭露者是曼彻斯特大学计算机科学系研究员 Andrew M. Webb,他在 Twit…

数位dp(求1-n中数字1出现的个数)
题意:求1-n的n个数字中1出现的个数。 解法:数位dp,dp[pre][now][equa] 记录着第pre位为now,equa表示前边是否有降数字(即后边可不能够任意取,true为没降,true为已降);常规的记忆化搜…
TensorRT Samples: MNIST API
关于TensorRT的介绍可以参考: http://blog.csdn.net/fengbingchun/article/details/78469551 以下是参考TensorRT 2.1.2中的sampleMNISTAPI.cpp文件改写的实现对手写数字0-9识别的测试代码,各个文件内容如下:common.hpp:#ifndef FBC_TENSORR…

免费学习AI公开课:打卡、冲击排行榜,还有福利领取
CSDN 技术公开课 Plus--AI公开课再度升级内容全新策划:贴近开发者,更多样、更落地形式多样升级:线上线下、打卡学习,资料福利,共同交流成长,扫描下方小助手二维码,回复:公开课&#…

Gamma阶段第一次scrum meeting
每日任务内容 队员昨日完成任务明日要完成的任务张圆宁#91 用户体验与优化:发现用户体验细节问题https://github.com/rRetr0Git/rateMyCourse/issues/91#91 用户体验与优化:发现并优化用户体验,修复问题https://github.com/rRetr0Git/rateMyC…

windows 切换 默认 jdk 版本
set JAVA_HOMEC:\jdk1.6.0u24 set PATH%JAVA_HOME%\bin;%PATH%转载于:https://www.cnblogs.com/dmdj/p/3756887.html
TensorRT Samples: GoogleNet
关于TensorRT的介绍可以参考: http://blog.csdn.net/fengbingchun/article/details/78469551 以下是参考TensorRT 2.1.2中的sampleGoogleNet.cpp文件改写的测试代码,文件(googlenet.cpp)内容如下:#include <iostream> #include <t…

Visual Studio Code Go 插件文档翻译
此插件为 Go 语言在 VS Code 中开发提供了多种语言支持。 阅读版本变更日志了解此插件过去几个版本的更改内容。 1. 语言功能 (Language Features) 1.1 智能感知 (IntelliSense) 编码时符号自动补全(使用 gocode )编码时函数签名帮助提示(使用…

资源 | 吴恩达《机器学习训练秘籍》中文版58章节完整开源
整理 | Jane出品 | AI科技大本营(ID:rgznai100)一年前,吴恩达老师的《Machine Learning Yearning》(机器学习训练秘籍)中文版正式发布,经过一年多的陆续更新,近日,这本书的中文版 58…

js字符串加密的几种方法
在做web前端的时候免不了要用javascript来处理一些简单操作,其实如果要用好JQuery, Prototype,Dojo 等其中一两个javascript框架并不简单,它提高你的web交互和用户体验,从而能使你的web前端有非一样的感觉,如海阔凭鱼跃。当然&…

Vue开发入门看这篇文章就够了
摘要: 很多值得了解的细节。 原文:Vue开发看这篇文章就够了作者:RandomFundebug经授权转载,版权归原作者所有。 介绍 Vue 中文网Vue githubVue.js 是一套构建用户界面(UI)的渐进式JavaScript框架库和框架的区别 我们所说的前端框架…
TensorRT Samples: CharRNN
关于TensorRT的介绍可以参考: http://blog.csdn.net/fengbingchun/article/details/78469551 以下是参考TensorRT 2.1.2中的sampleCharRNN.cpp文件改写的测试代码,文件(charrnn.cpp)内容如下:#include <assert.h> #include <str…

Python脚本BUG引发学界震动,影响有多大?
作者 | beyondma编辑 | Jane来源 | CSDN博客近日一篇“A guide to small-molecule structure assignment through computation of (1H and 13C) NMR chemical shifts”文章火爆网络,据作者看到的资料上看这篇论文自身的结果没有什么问题,但是,…

C++中public、protect和private用法区别
Calsspig : public animal,意思是外部代码可以随意访问 Classpig : protect animal ,意思是外部代码无法通过该子类访问基类中的public Classpig : private animal ,意思是告诉编译器从基类继承的每一个成员都当成private,即只有这个子类可以访问 转载于:https://blog.51cto.…
TensorRT Samples: MNIST(Plugin, add a custom layer)
关于TensorRT的介绍可以参考:http://blog.csdn.net/fengbingchun/article/details/78469551 以下是参考TensorRT 2.1.2中的samplePlugin.cpp文件改写的通过IPlugin添加一个全连接层实现对手写数字0-9识别的测试代码,plugin.cpp文件内容如下:…

AutoML很火,过度吹捧的结果?
作者 | Denis Vorotyntsev译者 | Shawnice编辑 | Jane出品 | AI科技大本营(ID:rgznai100)【导语】现在,很多企业都很关注AutoML领域,很多开发者也开始接触和从事AutoML相关的研究与应用工作,作者也是&#…

tomcat6 配置web管理端访问权限
配置tomcat 管理端登陆 /apache-tomcat-6.0.35/conf/tomcat-users.xml 配置文件,使用时需要把注释去掉<!-- <!-- <role rolename"tomcat"/> <role rolename"role1"/> <user username"tomcat" password"…

@程序员:Python 3.8正式发布,重要新功能都在这里
整理 | Jane、夕颜出品 | AI科技大本营(ID:rgznai100)【导读】最新版本的Python发布了!今年夏天,Python 3.8发布beta版本,但在2019年10月14日,第一个正式版本已准备就绪。现在,我们都…
TensorRT Samples: MNIST(serialize TensorRT model)
关于TensorRT的介绍可以参考: http://blog.csdn.net/fengbingchun/article/details/78469551 这里实现在构建阶段将TensorRT model序列化存到本地文件,然后在部署阶段直接load TensorRT model序列化的文件进行推理,mnist_infer.cpp文件内容…

【mysql错误】用as别名 做where条件,报未知的列 1054 - Unknown column 'name111' in 'field list'...
需求:SELECT a AS b WHRER b1; //这样使用会报错,说b不存在。 因为mysql底层跑SQL语句时:where 后的筛选条件在先, as B的别名在后。所以机器看到where 后的别名是不认的,所以会报说B不存在。 这个b只是字段a查询结…