集成学习知识点汇总
为啥叫集成学习
结合多个学习器来完成学习任务。
俗话说就是,团结力量大。个体学习器可以相同可以不同。如果相同叫同质集成,如果不尽相同叫异质集成。
个体学习器最好满足:好而不同。
所谓好(准确性),就是个体学习器不能太坏,也就是至少泛化性能不能弱于随机猜测的机器,所谓不同(多样性),要求学习器间具有差异。集成学习算法分类
序列化方法:学习器间存在强依赖关系,必须串行生成。
并行化方法:学习器间不存在强依赖关系,可以并行生成。序列化方法代表-AdaBoost
Boosting是一族可将弱学习器提升为强学习器的算法,其中最著名的代表是AdaBoost(损失函数为指数损失的Boosting算法)。
原理:先从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本的分布进行调整,使得先前基学习器做错的训练样本在后续受到更多关注(加大权重),然后基于调整后的样本分布来训练下一个基学习器;如此重复进行,直到基学习器数目达到事先指定的值T,最终将这T个基学习器进行加权结合。
特点:
①串行
②增加做错样本权重进行针对训练
③基学习器可以任意弱,同时可以创建任意强的分类器
解释:Boosting关注降低偏差,因此能基于泛化性能相当弱的学习器构建出很强的集成。
④输出结果是有权重的投票方式
优点:
①容易实现
②参数选择简单
③不容易过学习
需要提高的2个权重:
①错误分类样本
②错误率低的分类器
- 并行化方法代表1-Bagging
名称由来 Bootstrap AGGregatING
特点:
①基于Bootstrap采样生成训练集
②基学习器并行生成
③基学习器权重相同
④关注降低方差,因此在不剪枝决策树、神经网络等易受样本扰动的学习器上效果更明显。
- 并行化方法代表2-随机森林(RF)
来源:RF在以决策树为基学习器构建Bagging集成的基础上,进一步在决策树的训练过程中引入了随机属性选择。
可以说,RF是bagging的一个扩展变体。
特点:简单、容易实现、计算开销小、性能强大。
被誉为“代表集成学习技术水平的方法”。
PS:如有不足,恳请补充纠正。
相关文章:

hdu 2028 Lowest Common Multiple Plus
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid2028 题目大意:求最小公倍数,用辗转相除法。 1 #include <stdio.h>2 int main ()3 {4 int gcd(int a,int b);5 int a,b,n,i,c;6 while (scanf("%d",&n)…

TreeView
6.遍历TreeView节点(递归算法) private void Page_Load(object sender, System.EventArgs e) { GetAllNodeText(TreeView1.Nodes); } void GetAllNodeText(TreeNodeCollection tnc) { foreach(TreeNode node in tnc) { if(node.Nodes.Count!0) GetAllNodeText(node.Nodes); Res…

FZU 2297 Number theory【线段树/单点更新/思维】
Given a integers x 1, you have to apply Q (Q ≤ 100000) operations: Multiply, Divide. Input First line of the input file contains an integer T(0 < T ≤ 10) that indicates how many cases of inputs are there. The description of each case is given below: …

<软件过程与改进>计算大题考点总结与例题
1.PSP_PROBE估算法 常见考法:给历史数据,需要选择代理规模的估算值和程序规模/所需资源的实际值,用以下公式求得拟合公式参数 然后使用公式计算出未知的程序规模/所需资源 例题 2.PSP过程质量的度量指标_yield 常见考法:给出缺…

c语言exit和return区别,在fork和vfork中使用
转自c语言exit和return区别,在fork和vfork中使用 exit函数在头文件stdlib.h中。 简述: exit(0):正常运行程序并退出程序; exit(1):非正常运行导致退出程序; r…

WIKI与BLOG殊途同归(转)
现在很多朋友都拥有了自己的BLOG网页,尽管他们可能并不打算走木子美那种写私人日记的路子,但彰显个性、张扬自我的目的,大都类似。其实在这个时候,中国的许多技术迷们已经把目光投向了WIKI。 历经了网络反黄与木子美,中…

Spring MVC中DispatcherServlet理解总结(1)
DispatcherServlet在web.xml中的配置 <context-param><!--默认配置文件为/WEB-INF/[servlet名字]-servlet.xml--><param-name>contextConfigLocation</param-name><param-value>WebApplicationContext的上下文配置</param-value> </con…

功能点度量方法介绍
功能点度量方法是利用软件需求分析度量软件规模。 软件需求分析包括:软件功能需求分析、软件性能需求分析 在需求分析阶段可以利用数据流图和用例图对软件规模进行度量,分别对应功能点度量与用例点度量方法 1.功能点度量方法的分类 第三种 IFPUG是我…
微软2014校园招聘笔试试题
转载请标明出处,原文地址:http://blog.csdn.net/hackbuteer1/article/details/121908071、Which statement(s) is(are) correct about thread and process?Select all that apply.(5 Points) A、Threads share the same address space of the…

vi(vim)快捷键小记
1、前言 vi是“visual interface”的缩写,vim是vi IMproved(增强版的vi)。总结一下自己平时常用的vim快捷键,当是忘记也好,后续会不定期更新。 2、vim 快捷键 快捷键说明vi[m] file打开[新建]文件命令模式可以移动光标、删除字符等h,j,k,l左…

Premiere Pro2.0用DebugMode2.3搭桥小日本4.0输出图解
看图说话,不懂的多试试看首先明确几点:1。3个软件:Premiere Pro2.0、DebugMode(帧服务器)、小日本(TMPGEnc 4.0 XPress)2。渲染过程是在小日本中完成,与DebugMode无关,De…

用例点度量方法介绍
用例点度量方法分为6个步骤,分别是 step 1:计算未调整前的角色(执行者)权重 将角色按照复杂程度分为3类,具体如下 则本例中 UAW1121329 计算未调整前的用例权重UUC 有三种评估用例复杂程度的方法,具体如下 以下是用例权重评估表(普通那…

NYOJ——街区最短路径问题
街区最短路径问题 时间限制:3000 ms | 内存限制:65535 KB难度:4描述一个街区有很多住户,街区的街道只能为东西、南北两种方向。住户只可以沿着街道行走。各个街道之间的间隔相等。用(x,y)来表示住户坐在的街区。例如(…

Git 中常用的 4 个命令
使用 Git 进行版本管理时,肯定不只做提交,有时候也会需要回退修改,并且在回退的基础上进行重新提交,这时候有几个常用的命令就需要用到了,下面分别做介绍。 1、查看提交日志 首先,我们查看当前提交记录的命…

7月17日 晴
小懒猫,太阳晒PP拉Mua转载于:https://www.cnblogs.com/loverain/archive/2008/07/17/1244992.html

AS更改初始布局遇到的问题
将所有的simple.xml.ftl的内容都改成 <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_height"…

android Json解析详解
JSON的定义: 一种轻量级的数据交换格式,具有良好的可读和便于快速编写的特性。业内主流技术为其提供了完整的解决方案(有点类似于正则表达式 ,获得了当今大部分语 言的支持),从而可以在不同平台间进行数据交…

[二]Java虚拟机 jvm内存结构 运行时数据内存 class文件与jvm内存结构的映射 jvm数据类型 虚拟机栈 方法区 堆 含义...
前言简介 class文件是源代码经过编译后的一种平台中立的格式 里面包含了虚拟机运行所需要的所有信息,相当于 JVM的机器语言 JVM全称是Java Virtual Machine ,既然是虚拟机,他终归要运行在物理机上 在操作系统中体现出来的也就是一个进程 操作系统会给他分配资源,割一块内存作为…

import android.support.v7.widget.RecyclerView失败
换成 androidx.recyclerview.widget.RecyclerView 参考文章 https://blog.csdn.net/u013183608/article/details/89428611/

CrackMe_001
本系列文章的目的是从一个没有任何经验的新手的角度(其实就是我自己),一步步尝试将160个CrackMe全部破解,如果可以,通过任何方式写出一个类似于注册机的东西。 其中,文章中按照如下逻辑编排(解决如下问题)&…

用javascript实现的纵版飞行射击游戏—《天机》
花了一个半月的时间用javascript完成了这款web版飞行射击游戏,游戏效果接近一般的客户端游戏,不过对机器的要求稍微高点点,主要是CPU,最好在1.5GHZ以上,不然可能会比较卡,支持IE、FF、Opera、safari。 用ja…

对分组交换(packet switching)高效迅速灵活可靠四个优点的理解
1.什么是分组? 通信过程中要发送的整块数据被称为一个报文(message),报文被划分为一个个更小的等长数据段,每个数据段前加入一些由必要的控制信息组成的首部后,就构成了一个分组。分组是在互联网中传送的数据单元(长报文ÿ…

06、ActivationDeactivation
1、将App.xaml中的StartupUri"MainWindow.xaml"删除。 2、使用NuGet安装Prism.Wpf、Prism.Core、Prism.Unity。 3、添加类“Bootstrapper”,编辑如下: 1 using System;2 using System.Collections.Generic;3 using System.Linq;4 using System…

Git 学习笔记一
Git的基本配置和使用 一、git add ;git commit;git commit -a(默认跟踪修改直接提交(不包括新文件))。 二、tig命令 查看修改记录的前端工具,方面查看修改记录。相当于git log –p。 三、git config --global alias.ci "commit -a -v"添加命令别名&#x…

vb 取得计算机名及目录
Public gCompName 取得计算机名及Windows目录 Dim i% Dim c$ Dim cSql As String Dim cProduct As String c Space(256) i GetComputerName(c, 256) gCompName Trim(c) gCompName Left(gCompName, Len(gCompName) - 1) 读取MAC地址 Dim…

速率单位和信息量单位区分
网络技术钟的速率指的是数据的传送速率,也称为数据率或比特率。 单位是bit/s 比特每秒 也写作b/s 或bps(bit per second) 当数据率较高时 常常在bit/s前面加一个字母,如 k 10^3 M 10^6 G 10^9 T 10^12 P 10^15 …… 数据量往往用字节B作为度量单位…

python 自动生成C++代码 (代码生成器)
python 代码自动生成的方法 (代码生成器) 遇到的问题 工作中遇到这么一个事,需要写很多C的底层数据库类,但这些类大同小异,无非是增删改查,如果人工来写代码,既费力又容易出错;而借用…

WPF实用指南二:移除窗体的图标
原文:WPF实用指南二:移除窗体的图标WPF没有提供任何功能来移除窗体上的icon图标。一般的做法是设置一个空白的图标,如下图1: 这种做法在窗体边框与标题之间仍然会保留一片空白。比较好的做法是使用Win32API提供的函数来移除这个图标。使用如下的代码&…

什么是EAI?
什么是EAI(enterprise application integration)企业应用集成? EAI是将基于各种不同平台、用不同方案建立的异构应用集成的一种方法和技术。EAI通过建立底层结构,来联系横贯整个企业的异构系统、应用、数据 源等,完成在企业内部的 ERP、CRM、SCM、数据库…