机器学习模型 知乎_机器学习:模型评估之评估方法
机器学习已经成为了人工智能的核心研究领域之一,它的研究动机就是为了让计算机系统具有人的学习能力以便实现人工智能。目前,关于机器学习定义的说法比较多,而被广泛采用的定义是“利用经验来改善计算机系统自身的性能”。由于“经验”的主要存在形式便是数据,因此机器学习就需要运用机器学习技术对数据进行分析。机器学习技术是机器学习的主要研究对象,包括:线性学习、支持向量机学习、神经网络学习、决策树学习、贝叶斯学习、最近邻学习等等。
机器学习课程包括几个重要部分,例如:模型评估、线性学习、支持向量学习、神经网络学习、决策树学习、贝叶斯学习、最近邻学习、无监督学习、集成学习、代价敏感学习、演化学习、强化学习(以上的顺序便是小猿君学习机器学习课程的顺序,即笔记内容的顺序)。
首先要学习的自然是模型评估,模型评估的主要内容有三部分,分别是评估方法、评估指标和比较检验。本篇笔记便是是评估方法的主要内容。
在学习得到的模型投放使用之前,通常要对其进行性能评估,为此就需要使用一个“测试集”,来测试模型对新样本的泛化能力,然后以测试集上的“测试误差”来作为“泛化误差”的近似。假设测试集是从样本真实分布中独立采样得到的,因此训练集和测试集中的样本要尽量互斥,即两个集合的样本没有交集。
将数据集分成训练集S和测试集T,通常的做法包括留出法、交叉验证法以及自助法。
留出法:
主要特征为:
√ 直接将数据集划分为两个互斥的集合。
√ 训练/测试集划分要尽可能保持数据分布的一致性。
√ 一般为若干次随机划分、重复实验取平均值(目的是减小误差)。
通常训练样本和测试样本的比例为2:1~4:1。
交叉验证法:
将数据集分层采样划分为K个大小相似的互斥子集,每次用K-1个子集的并集作为训练集,余下的子集作为测试集,最终返回K个测试结果的均值,K最常用的取值是10。

10折交叉验证示意图
将数据集D划分为K个子集同样存在多种划分方式,为了减小因样本划分不同而导致的差别,K折交叉验证通常随机使用不同的划分重复P次,最终的评估结果是这P次K折交叉验证结果的均值。
当然,当数据集D包含m个样本,另K=m,得到的便是留一法:
√ 不受随机样本划分方式的影响
√ 结果往往比较准确
√ 当数据集比较大时,计算开销难以忍受
自助法:
以自助采样法为基础,对数据集D有放回采用m次得到训练集D`,DD`用作测试集:
√ 实际模型与预期模型都使用m个训练样本
√ 约有1/3的样本没有在训练集中出现,用作测试集
√ 从初始数据集中产生多个不同的训练集,对集成学习有很大的好处
√ 自助法在数据集较小、难以有效划分训练/测试集时很有用;由于改变了数据集分布,可能引入估计偏差,在数据量足够时,留出法和交叉验证法更常用
以上就是模型评估中评估方法的全部笔记。
相关文章:

NSDate NSCalendar NSString之间的故事以及转换
1.NSDate 和 NSString 之间的转换 这之间的转换主要依靠NSDateFormatterNSDate <------> NSStringNSDateFormatter *formatter [[NSDateFormatter alloc]init];formatter.dateFormat "yyyy-MM-dd HH:mm:ss";NSString *strDate [formatter stringFrom:date];…

bzoj 4695: 最假女选手
……一道丧病线段树膜板题…… 被常数卡的死去活来……QAQ 学到了些奇技淫巧:把取min标记 和 区间最小值 合并 可以快很多…… #include <bits/stdc.h> #define lc(t) ((t) << 1) #define rc(t) (((t) << 1) | 1) #define N 2000010 #define INF …

python 打包 .app 运行 控制台窗口_Python打包工具
1 Python打包工具目前在windows平台上将Python程序打包成exe文件主要有三个工具。今天将一个Tkinter写的界面程序打包成exe文件,三个工具都试了一遍,感觉PyInstaller会比较好用一些。2 py2exe2.1 下载安装2.2 启动脚本写一个setup_py2exe.py文件from dis…

地址池命令 思科理由_思科互联网络操作系统 ——路由器接口
点击蓝字关注我们路由器接口接口配置是最重要的路由器配置之一,因为若没有接口,路由器几乎就毫无用处。另外,要与其他设备通信,接口配置必须绝对精确。配置接口时,我们需要指定网络层地址、介质类型和带宽,还需使用其他管理命令。…

mysql数据去重语句_数据库 mysql 语句
LAMP: Linux系统 A阿帕奇服务器 Mysql数据库 Php语言mysql:常用代码create table CeShi1(Uid varchar(50) primary key,Pwd varchar(50),Name varchar(50),Nation varchar(50),foreign key(Nation) references Nation(Code))写查询语句需要注意:1.创建表的时候&…

mysql中utf8_bin、utf8_general_ci、utf8_general_cs编码区别
转载地址: https://www.cnblogs.com/exmyth/p/3616672.html在mysql中存在着各种utf8编码格式,如下表:1)utf8_bin2)utf8_general_ci3)utf8_general_csutf8_bin将字符串中的每一个字符用二进制数据存储,区分大…

利用闭包实现多次ajax请求只执行最后一次
点一个按钮,则向服务器请求资源,不作处理时,多次点击后会有很多个请求在等待。我们知道一般我们用ajax是异步请求,那么我们快速重复点击一个按钮得到的结果其实我们并不知道是哪次点击的结果可能是第一次可能是最后一次也可能是第…

3dmax批量导出fbx_推荐一款超实用的3DMAX插件——模法师
模法师集成于3DMAX上,到老子云平台下载插件后,直接双击运行安装就能使用了。有多好用呢?好比游戏开了挂,效率瞬间翻几番。主要提供三大功能:1、批量格式转换简单地说,你可以把大量模型文件,同时…

python实现平衡二叉树_LeetCode 110. 平衡二叉树 | Python
# 110. 平衡二叉树---题目来源:力扣(LeetCode)[https://leetcode-cn.com/problems/balanced-binary-tree](https://leetcode-cn.com/problems/balanced-binary-tree)## 题目---给定一个二叉树,判断它是否是高度平衡的二叉树。本题中,一棵高度…

「欧拉定理」学习笔记(费马小定理)
欧拉定理:对于互质的两个正整数$a, n$,满足$a^{φ(n)} ≡ 1\ (mod\ n)$ 证明: 设集合$S$包含所有$n$以内与$n$互质的数,共有$φ(n)$个:$$S \{ x_1, x_2, ..., x_{φ(n)} \} $$ 再设集合$T$:$$T \{ a * x…

Python将MySQL表数据写入excel
背景:将mysql表查询结果写入excel。 1.使用sqlyog工具将查询结果导出到Excel.xml中,用excel打开发现:因为text字段中有回车换行操作,显示结果行是乱的。 2.用mysql -uadmin -p -h -P -NBe"select * from tb;" >>a…

nacos动态配置数据源_Jasper 怎么配置动态数据源
Jasper 本身是不支持动态数据源的,能用的解决方式是通过 api 自定义数据源,实际操作就是根据条件判断后动态设定 jdbc 的 url、用户名及密码等连接属性。比如:String userName userDetails.getUsername();// obtain a connection based on t…

Linux命令之top
top –hv | -abcHimMsS –d delay –n iterations –p pid [, pid …] top程序提供运行系统的动态实时视图,它可以显示系统概要信息以及当前由Linux内核当前管理的任务列表。所示的系统概要信息的类型以及为任务显示的信息的类型、顺序和大小都是用户可配置的&#…

seal report mysql_Seal Report开放数据库报表工具(.Net)
概述:开放数据库报表工具(.Net)简介:Seal-Report提供了一个完整的框架,用于从任何数据库生成日常报告和仪表板。Seal-Report是Microsoft .NET Framework完全用C#编写的开源工具。Seal Report算是报表工具中比较好用的一个…

注册亚马逊云服务
要英文填写还要字符限制,好严格 转载于:https://www.cnblogs.com/ZHONGZHENHUA/p/6249805.html

行波iq调制器_高速InP基半导体电光调制器行波电极结构研究
【1】Winzer P J, Essiambre R J. Advanced modulation formats for high-capacity optical transport networks[J].Lightwave Technol., 2006, 24(12):4711-4728.【2】Dagli N.High-speed photonics device[M]. Taylor & Francis, 2007.【3】Zhang L,Sinsky J, Thourhout …

PIXI 下落文字消除(3)
图片示例,简陋的图,记录下落过程, 1、创建应用实例并添加到DOM元素上。 (会看到一个黑色画布,没有任何元素,接下来会在画布上创建文字) 2、创建 TextStyle 用来设置要显示字体样式 3、随机产生…

python魔术方法call_php魔术方法__call
__call是魔术方法中的一个,当程序调用到当前类中未声明或没权限调用的方法时,就会调用__call方法class test{public function emptyFunc(){$getArgs func_get_args();$funcName $getArgs[0];//$params array_slice($getArgs, 1);//var_dump($params);…

app启动时间命令
app启动: 冷启动和热启动 冷启动方式: adb shell am start -W -n package/activity 停止app命令: adb shell am force-stop package 热启动命令和冷启动命令一样 停止命令: adb shell input keyevent 3 查看package/activity命令&…

华为手机媒体音量自动静音_华为手机的音量键还可以这么用,涨见识!
身边很多朋友都是用的是华为手机,我就纳闷了,华为手机真的有那么好用吗?听朋友跟我细细说了一番,我被说动了,准备也去换一个华为手机,就冲它的音量键有那多妙用,我也不能错过一款华为手机&#…

Mui.ajax请求服务器正确返回json数据格式
ajax: mui.ajax(http://server-name/login.php,{data:{username:username,password:password},dataType:json,//服务器返回json格式数据type:post,//HTTP请求类型timeout:10000,//超时时间设置为10秒;success:function(data){//服务器返回响应࿰…

day1作业(格式化输出)
练习:用户输入姓名、年龄、工作、爱好 ,然后打印成以下格式------------ info of Egon -----------Name : EgonAge : 22Sex : maleJob : Teacher ------------- end -----------------完成情况:in_nameinput(请输入您的姓名࿱…

rust 官服指令_RUST 命令大全(包括服务器指令)
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼RUST MOD(以下在聊天框内输入)基本命令/share playername 【shares your doors with a player(共享你的门给一个玩家)】/unshare playername 【unshares your doors with a player(解除对一个玩家的门共享)】/help 【Shows command…

postgresql存图片字段类型_PostgreSQL 入门 | Linux 中国
安装、设置、创建和开始使用 PostgreSQL 数据库。-- Greg Pittman每个人或许都有需要在数据库中保存的东西。即使你执着于使用纸质文件或电子文件,它们也会变得很麻烦。纸质文档可能会丢失或混乱,你需要访问的电子信息可能会隐藏在段落和页面的深处。在我…

关于ES6中Promise的应用-顺序合并Promise,并将返回结果以数组的形式输出
1.Promise 基础知识梳理 创建一个Promise实例 const promise new Promise(function(resolve, reject) {if (success){resolve(value);} else {reject(error);} }); Promise构造函数接受一个函数作为参数,该函数的两个参数分别是resolve和reject。它们是两个函数&am…

Java计算两个字符串日期之间的天数差
Java计算两个字符串日期之间的天数差 调用方法: public static void main(String[] args) throws ParseException {String a "2017-12-01"; // 时间字符串String b "2017-12-31";Long between_dayInteger between_days(a, b);System.out.pri…

java file_Java IO: File
原文链接 作者: Jakob Jenkov 译者: 李璟(jlee381344197gmail.com)Java IO API中的FIle类可以让你访问底层文件系统,通过File类,你可以做到以下几点:检测文件是否存在读取文件长度重命名或移动文件删除文件检测某个路径是文件还是目录读取目录…

数学建模优化模型简单例题_数学建模之优化模型:存储模型
点击上方「蓝字」关注我们最近,为申报市级精品课程,我为我校“数学建模与科学计算”课程录制了讲课视频,下面是3.1节优化模型的第一个例子:存储模型。敬请大家批评指正!优化模型是数学建模里比较简单、但也非常常用的建…

shiro异常类型
<!-- 身份认证异常 --> <!-- 身份令牌异常,不支持的身份令牌 --> org.apache.shiro.authc.pam.UnsupportedTokenException <!-- 未知账户/没找到帐号,登录失败 --> org.apache.shiro.authc.UnknownAccountException <!-- 帐号锁定 --&…

生产环境下Centos 6.5优化配置 (装载)
本文 centos 6.5 优化 的项有18处: 1、centos6.5最小化安装后启动网卡 2、ifconfig查询IP进行SSH链接 3、更新系统源并且升级系统 4、系统时间更新和设定定时任 5、修改ip地址、网关、主机名、DNS 6、关闭selinux,清空iptables 7、创建普通用户并进行sudo授权管理 8…