【组队学习】【25期】Datawhale组队学习内容介绍
第25期 Datawhale 组队学习活动马上就要开始啦!
本次组队学习的内容为:
- web开发入门教程
- 数据挖掘实战(异常检测)
- 集成学习(下)
大家可以根据我们的开源内容进行自学,也可以加入我们的组队学习一起来学。
1. web开发入门教程
开源内容:
https://github.com/datawhalechina/whale-web
学习目标
- 熟悉datawhale项目开发流程
- 掌握REST前后端分离理念及OpenAPI文档编写
- 掌握Django后端开发技术架构
- 掌握Vue前端开发
- 掌握前后台端对接
基本信息
- 贡献人员:张梁、王晓亮、何锋丽、张少波、谢文昕
- 学习周期:16天
- 学习形式:自学 + 实操 + 交流
- 人群定位:有一定编程基础的同学,有实际开发经验更佳。
- 难度系数:中
任务安排
Task00:环境搭建和初步了解(2天)
- 组队、修改群昵称
- 熟悉打卡规则
- 熟悉REST风格系统
- 熟悉OpenAPI规范
- 了解Django框架
- 了解Vue.js框架
- 独立完成数据库安装
- 独立完成代码运营
Task01:熟悉后端代码结构及OpenAPI文档编写(2天)
- 后端代码目录结构
- 后端RESTful API URL定义
- 查看已实现的接口及内容
- 使用swagger-editor编辑接口文档并补充遗漏的接口
Task02:熟悉datawhale需求及编写新API文档(2天)
- 熟悉用户及权限管理需求
- 设计用户及权限管理相关RESTful API
- 补充openapi.yaml并添加用户及权限管理相关入口
- 熟悉赛事管理需求
- 设计赛事管理相关RESTful API
- 补充openapi.yaml并添加赛事管理相关入口
Task03:熟悉首页需求并使用Vue实现首页功能(2天)
- 前端代码目录结构
- vue-router简介
- vuex状态管理
- 熟悉vuetify material design组件库并使用
- 基于交互图实现首页功能
Task04:开发用户管理后端及前端(4天)
- [后端]修改已有Model并添加用户属性,同步数据表
- [后端]实现对应序列化类及View
- [后端]创建URL与View的映射
- [前端]创建用户列表页及用户详情页
- [前端]创建用户列表路由及用户详情路由
- 线上环境部署及集成测试
Task05:开发赛事管理后端及前端(4天)
- [后端]新建赛事相关Model并初始化数据表
- [后端]实现对应序列化类及View
- [后端]创建URL与View的映射
- [前端]创建赛事列表页及赛事编辑页面
- [前端]创建赛事列表路由及赛事编辑路由
- 线上环境部署及集成测试
2. 数据挖掘实战(异常检测)
开源内容:
https://github.com/datawhalechina/team-learning-data-mining/tree/master/AnomalyDetection
学习目标
理解传统的异常检测方法原理,并具备基本的调用相应python库进行操作的能力。
基本信息
- 贡献人员:梁家晖、李玲、李芝翔、赵可、陈信达、林星良
- 学习周期:15天,每天平均花费时间2小时-5小时不等,根据个人学习接受能力强弱有所浮动。
- 学习形式:理论+实践
- 人群定位:熟悉数据挖掘的基本方法,对学习异常检测算法有需求的学员。
- 先修内容:Python编程语言、编程实践(Numpy)、编程实践(Pandas)、编程实践(数据可视化)
- 难度系数:中
任务安排
Task00:熟悉规则(1天)
- 组队、修改群昵称
- 熟悉打卡规则。
Task01:异常检测介绍(2天)
- 了解异常检测基本概念
- 了解异常检测基本方法
Task02:基于统计学的方法(3天)
- 掌握基于高斯分布的异常检测方法
- 理解非参数异常检测方法
- 掌握HBOS算法
Task03:线性模型(3天)
- 理解线性回归
- 掌握主成分分析的异常检测方法
Task04:基于相似度的方法(3天)
- 理解基于距离的异常检测方法
- 掌握基于密度的LOF算法
Task05:高维异常检测(3天)
- 了解集成方法的思想
- 理解feature bagging原理
- 掌握孤立森林算法
3. 集成学习(下)
开源内容:
https://github.com/datawhalechina/team-learning-data-mining/tree/master/EnsembleLearning
基本信息
- 贡献人员:李祖贤、薛传雨、赵可、杨毅远、陈琰钰、李嘉骐
- 学习周期:15天
- 学习形式:理论学习 + 练习
- 人群定位:已完成集成学习(上)、(中)课程内容的学习,具备《高等数学》、《线性代数》、《概率论与数理统计》基础,了解机器学习经典模型的理论知识,能够调用相应模型库解决的学习者。
- 每个任务完成大概所需时间:3-5h
- 任务路线:掌握基本的模型集成方法和常见组合集成模型的理论及模型调用调参
- 难度系数:中
之前大家系统学习了机器学习的经典的算法、bagging/boosting等基本集成方法的思路、理论推导和库文件调用。本次我们将学习使用多个模型的训练结果进行最终的融合。之前的学习中我们一直使用模型库自带的小型数据来进行练习,本次在模型训练和融合全部完成后,我们还将使用两个较大的真实数据来进行完整的调参融合练习。我们从数据预处理开始,到子分类器的训练,再到集成学习,一步一步深入浅出,手把手带领大家直观感受集成学习。
⚠️ 特别提示:已报名并完成集成学习(中)所有学习内容的同学不需要重复报名。直接报名集成学习(下)的同学需要自行完成集成学习(上)、(中)课程内容的学习。
学习目标
本次课程是由Datawhale集成学习小组内部成员共同完成,是针对机器学习小白的一入门课程。学习本课程需要学习者具备《高等数学》、《线性代数》、《概率论与数理统计》基础,会使用常见的数据分析工具(Numpy,Pandas、matplotlib)。
本次课程内容的设计参考了B站很火的《白板推导》系列、李航老师的《统计学习方法》、机器学习入门圣经的《统计学习导论》以及大量的技术博客,详细地介绍了机器学习领域中最经典的算法并给出了相应的数学推导和代码,对于每个算法都进行了细致的分析以及必要的代码的演示,便于学习者深刻理解机器学习算法的本质。除此之外,每个算法都要求学习者自行查阅sklearn官方文档的相应参数,帮助学习者构建理论与实际相结合的学习框架。在这些案例的代码中,我们给出了详细的代码注释,尽量让学习者们不会因为看不懂代码而感到烦恼。
任务安排
Task00:熟悉规则(1天)
- 组队、修改群昵称
- 熟悉打卡规则
Task12:Blending集成学习算法(2天)
Blending是学习Stacking算法的基础,不知道大家小时候有没有过这种经历:老师上课提问到你,那时候你因为开小差而无法立刻得知问题的答案。就在你彷徨的时候,由于你平时人缘比较好,因此周围的同学向你伸出援手告诉了你他们脑中的正确答案,因此你对他们的答案加以总结和分析最终的得出正确答案。相信大家都有过这样的经历,这就是Blending算法的核心。
Task13:Stacking集成学习算法(2天)
Blending在集成的过程中只会用到验证集的数据,对数据实际上是一个很大的浪费。为了解决这个问题,如果能将交叉验证的思想附加到集成算法中,将能顺利解决这个问题,Stacking算法就是这么诞生的。Stacking的思路是先使用交叉验证训练多个不同模型,然后使用Blending方法将交叉验证的结果堆叠融合,以获得更高的预测准确率。
Task14:集成学习案例一 (幸福感预测)(5天)
通过前13个task的学习,我们已经掌握了集成学习的基础知识和多种基本算法,那集成学习中的算法在实践中是如何使用的呢?“幸福感预测”这一案例就是以分类为目标的集成学习。此案例是一个数据挖掘类型的比赛——幸福感预测的baseline。比赛的数据使用的是官方的《中国综合社会调查(CGSS)》文件中的调查结果中的数据,其共包含有139个维度的特征,包括个体变量(性别、年龄、地域、职业、健康、婚姻与政治面貌等等)、家庭变量(父母、配偶、子女、家庭资本等等)、社会态度(公平、信用、公共服务)等特征。
Task15:集成学习案例二 (蒸汽量预测)(5天)
不同于task14的“幸福感预测”的分类问题,本案例中的“蒸汽量预测”是以回归为目标的集成学习。此案例的数据产生于实际的工业大数据的生产中,具有十分重要的现实意义,经脱敏后的锅炉传感器采集的数据(采集频率是分钟级别),根据锅炉的工况,预测产生的蒸汽量。与上面的案例相同,本案例展示了一个完整的集成学习解决方案供大家参考和改进。通过以上较为全面的案例分析,希望帮助大家更加直观、深入地学会使用集成学习的思想来解决自己所面对的问题。
4. 具体规则
- 注册 CSDN、Github 或 B站等账户。
- 按照任务安排进行学习,完成后写学习笔记Blog 或 进行视频直播。
- 在每次任务截止之前在群内填写问卷打卡,遇到问题在群内讨论。
- 未按时打卡的同学视为自动放弃,被抱出学习群。
相关文章:

为pony程序添加IACA标记(二)
在上一篇文章介绍了一种加IACA标记的方法,但使用还是很麻烦,所以我尝试修改pony编译器,直接增加了IACA支持,目前代码在iaca分支。 使用方法 因为还没发PR到上游,所以要自己克隆编译。 git clone https://github.com/or…

Python培训就业怎么样?
学习Python技术的同学越来越多,很多人都比较看好Python这项技术,觉得Python的前景是不错的,那么具体Python培训就业怎么样呢?来看看下面的详细介绍就知道了。 Python培训就业怎么样?国家大力推行互联网人工之智能技术、大数据技术等&#x…

Oracle Connect to an idle instance
意思是数据库没有启动。转载于:https://www.cnblogs.com/vigarbuaa/archive/2012/09/05/2671825.html

【青少年编程】【Scratch】10 画笔模块
10 画笔模块 有关于画笔模块,需要掌握以下两个方面的内容: 能够设置画笔的属性:颜色、粗细、亮度/饱和度/透明度能够使用画笔绘制各种图案:抬笔、落笔、擦除 1. 使用者可以设置各种画笔属性。 另外,可以将角色设置为…

4-1 ADO.NET简介
第四章ADO.NET数据库访问技术本章内容4-1 ADO.NET 简介4-2 ADO.NET-插入、删除、修改、检索数据4-3 DataGridView 控件 — 显示和操作数据4-4本章小结 本章重点介绍WINDOWS应用程序对数据访问所涉及的SYSTEM.DATA.SQLCLIENT、SYSTEM.DATA.OLEDB、SYSTEM.DATA.ORA…

Java培训出来后一般多少工资
学完Java培训出来后一般多少工资呢?这是很多人都比较关心的一个问题,小编在这里告诉大家,java技术这个岗位分为初级、中级和高级,每个等级的工资情况也是不一样,来看看下面的详细介绍。 Java培训出来后一般多少工资?Java程序员薪…

NeHe OpenGL第四十一课:体积雾气
NeHe OpenGL第四十一课:体积雾气 体积雾气 把雾坐标绑定到顶点,你可以在雾中漫游,体验一下吧。 这一课我们将介绍体积雾,为了运行这个程序,你的显卡必须支持扩展"GL_EXT_fot_coord"。 #include <wi…

如何做中文文本的情感分析?
如何做中文文本的情感分析? 这是本学期在大数据哲学与社会科学实验室做的第三次分享了。 第一次分享的是:如何利用“wordcloudjieba”制作中文词云? 第二次分享的是:如何爬取知乎中问题的回答以及评论的数据? 本次…

java游戏开发--连连看-让程序运行更稳定、更高效
之六)优化:让程序运行更稳定、更高效 改善游戏的合理性 到目前为止,我们的游戏基本上算是完成了,为了使程序更合理,我们还需要将整个程序从头再理一遍,看看有没有改进的地方。 首先,在变量的…

学java是不是必须要参加java培训班?
学java是不是必须要参加java培训班?java技术对于零基础的同学来说学习起来是比较困难的,所以对于这个问题,小编的回答是当然要参加java培训班进行系统学习,下面来看看到底有没有必要报班学习? 学java是不是必须要参加java培训班?学习Java无…

【青少年编程】黄羽恒:我要背单词
「青少年编程竞赛交流群」已成立(适合6至18周岁的青少年),公众号后台回复【Scratch】或【Python】,即可进入。如果加入了之前的社群不需要重复加入。 微信后台回复“资料下载”可获取以往学习的材料(视频、代码、文档&…

【转载】:最佳注释
原文地址:http://blog.xiqiao.info/2012/08/29/1240 转载于:https://www.cnblogs.com/TianFang/archive/2012/09/05/2672558.html

从 C++ 到 Objective-C
开始一个新的系列《从 C 到 Objective-C》。欢迎感兴趣的童鞋看看。在做完《让你的 Qt 桌面程序看上去更加 native》之后,也会把这个系列搬到这里来吧。不过这是后话了…;-P 地址:http://www.devbean.info PS:话说 wordpress 还是更好用一些……

参加UI设计培训如何高效学习
想要成为一名合格的UI设计师,扎实的基础知识是要到位的,那么如何在短时间内学会UI设计技术呢?那么就要了解高效的学习方法了,下面就为大家详细的介绍一下参加UI设计培训如何高效学习? 参加UI设计培训如何高效学习? 一、1%原则 让自己变得更…

访问级别约束0906
1 访问级别约束子类访问级别不能比父类高 儿子能去的地方老子一定能去方法、属性等暴露的返回值、参数的数据类型不能比方法、属性或者所在类的可访问级别低,因为这些方法、属性要能在高级场合出现,如果用到的类型却不能在这个场合出现就明显不合理了&am…

VSCode环境下配置ESLint 对Vue单文件的检测
本文介绍了在VSCode环境下如何配置eslint进行代码检查,并介绍了如何对.vue单文件进行支持。 ESLint 安装1.在工程根目录下,安装eslint及初始化 $ npm install eslint --save-dev $ ./node_modules/.bin/eslint -- --init //会输出几个问题,指…

【青少年编程】黄羽恒:加减乘除法小测试
「青少年编程竞赛交流群」已成立(适合6至18周岁的青少年),公众号后台回复【Scratch】或【Python】,即可进入。如果加入了之前的社群不需要重复加入。 微信后台回复“资料下载”可获取以往学习的材料(视频、代码、文档&…

Python Cookie HTTP获取cookie并处理
本期Python培训教程是教大家如何进行HTTP获取cookie并处理的方法,希望本期教程能够给大家带来帮助,请看以下详细内容介绍。 Cookie模块同样是Python标准库中的一员,它定义了一些类来解析和创建HTTP 的 cookie头部信息。 一、创建和设置Cookie…

利益驱动 需求驱动 技术驱动 谁才是真正的驱动力?
作java码工也有上段日子了,没有调查,就没有发方权。更何况自已是亲身试了一把,有人说程序员就是二代农民工,我还是比较赞同的,对于刚入道的同仁们来说确实就是个体力活。真就迁扯不到什么高深的算法,虽然在…

【青少年编程】黄羽恒:翻译小工具 -- 利用有道翻译
「青少年编程竞赛交流群」已成立(适合6至18周岁的青少年),公众号后台回复【Scratch】或【Python】,即可进入。如果加入了之前的社群不需要重复加入。 微信后台回复“资料下载”可获取以往学习的材料(视频、代码、文档&…

iframe 自动适应高和宽问题 和 其他Frame操作技巧
< DOCTYPE html PUBLIC -WCDTD XHTML TransitionalEN httpwwwworgTRxhtmlDTDxhtml-transitionaldtd> iframe 自动适应高和宽问题iframe的滚动条很难看,很多时候需要自动调整高和宽 扩展到使页面显示正常。搜索了一下,以下是解决办法:fu…

Python代码编写过程中有哪些重要技巧?
近几年,转行做Python技术岗的人越来越多,大家对于Python的关注越来越高,尤其是工作后,很多人都想知道Python代码编写过程中有哪些重要技巧?小编告诉大家,在编写Python代码过程中,除了在意代码的功能性&…

SpringMVC启动分析
以下分析基于JDK1.8 启动的第一步是执行监听器,这里web.xml中配置了一个监听器org.springframework.web.context.ContextLoaderListener 接下来,看ContextLoaderLisener 在Web应用启动的时候,所有的ServletContextListener会在filter和servle…

Edit Distance
题意是求俩字符串的编辑距离,编辑定义有三种1、插入字符 2、删除字符 3、替换字符。 int minDistance(string word1, string word2) { if (word1.size() 0) return (int)word2.size(); if (word2.size() 0) return (int)word1.size(); int result 0; int *dist …

【青少年编程】黄羽恒:翻译小工具 -- 利用百度翻译
「青少年编程竞赛交流群」已成立(适合6至18周岁的青少年),公众号后台回复【Scratch】或【Python】,即可进入。如果加入了之前的社群不需要重复加入。 微信后台回复“资料下载”可获取以往学习的材料(视频、代码、文档&…

UI设计师面试时如何介绍自己?
很多人在学会UI设计技术之后,那么接下来就是要进行面试找工作了,那么UI设计师面试时如何介绍自己?有哪些需要注意的呢?来看看下面的详细介绍。 UI设计培训分享:UI设计师面试时如何介绍自己? 一、投其所好 清楚自己的强项后,便可…

Silverlight:SSL教程
在Silverlight与WCF进行通信的过程中,数据安全就成为了一个非常关键的因素,如果不作任何限制,那么数据被抓包篡改等情况都是对系统的潜在威胁.本文主要介绍通过SSL配置WCF进行通信. 对于WCF的安全,主要分为传输/消息安全,在阅读本文时,你需要了解相关的知识,本文不做此部分介绍…

SANBoot安装系统
环境: 硬件:3台DELL R910无盘带2G SD卡 1台DELL MD3820F存储双控 2台光纤交换机 软件:windows server 2012 r2 with cu1 目标:R910服务器的系统从存储划分的lun中sanboot引导启动,并实现光纤双链路高可用,搭…

Datawhale组队学习周报(第012周)
本周(05月03日~05月09日),第 24 期组队学习已经全部结营。另外,第 25 期组队学习也与大家见面了。我在这里要感谢所有的航路开辟者(课程设计者),以及我们的航海士(专业助教ÿ…

适合初学者的java书籍
学习java技术除了报Java培训班还有自学,书本知识一定不能忘了,书本知识带来的价值更直观,也方便记录,下面小编就为大家详细的介绍一下适合初学者的java书籍。 java培训分享适合初学者的java书籍: 1.Head First Java 首…