当前位置: 首页 > 编程日记 > 正文

李宏毅机器学习笔记(五)-----Where does the error come from

视频来源:

李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili

https://www.bilibili.com/video/av10590361/?p=5

function set   === model

error来源:

(1)baise

(2)variance


问题一:  怎么估算Biase和Variance -------数理统计中的点估计


点估计步骤:

(1)抽取样本

(2)计算样本的均值,方差等

(3)使用统计量近似估算总体的方差,均值

百度介绍点估计:

点估计_百度百科

https://baike.baidu.com/item/%E7%82%B9%E4%BC%B0%E8%AE%A1/10842926?fr=aladdin

如图:

(1)baise就相当于眼睛瞄准的时候是否有偏差以及偏差的多少

(2)variance就是瞄准之后手是否抖动或者是设备的好坏

分析:

第一张图表示蓝色点在靶心的位置,也就是瞄准了以及手也没抖

第二张瞄准了(点散落在靶心的周围)但是手抖了




model复杂性与散布的关系:

简单的model不怎么受不同data的影响比较小(想的少,没心没肺),他自己会找到符合自己的曲线的数据

复杂的model'就是想的比较多(劳碌命),每一个不同的数据它都想囊括进来(一个都不能少)


Biase

黑色:  真实的曲线(靶心)

红色:每次不同model500次运行(图中为一次多项式和三次多项式模型)

蓝色:500次的平均


结论:

(1)复杂的均值更接近与靶心,有较小的baise。   所有有可能错过靶心

(2)model只考虑部分的点,比如线性的将其他不符合的舍弃会造成大的baise

baise 大

解决方案:

(1)重构model

(2)加入更多的特征



variance比较大(手抖-----)解决的方案

(1)增加data

(2)Regularization----强迫是曲线更平滑

regularzation  正则化

影响:

(1)可能对baise造成影响,错过靶心

机器学习之正则化(Regularization) - Acjx - 博客园

https://www.cnblogs.com/jianxinzhou/p/4083921.html




重点:  就是在baise和variance中取得平衡


why not do

(1)在试验中我们使用的Testing 是自己已经知道的局部的一些总体的数据也就是真正的Testing我们是没有的

(2)我们自己设置的Testingset也存在自己的偏差,而这个可能是无法避免的因为我们需要自己进行分出训练集和测试集。故而我们若是选择了model  在我们自己分配的测试集中的error最小的可能造成在真正的应用中error会超级大


交叉验证思想介绍

编辑
在使用训练集对参数进行训练的时候,经常会发现人们通常会将一整个训练集分为三个部分(比如mnist手写训练集)。一般分为:训练集(train_set),评估集(valid_set),测试集(test_set)这三个部分。这其实是为了保证训练效果而特意设置的。其中测试集很好理解,其实就是完全不参与训练的数据,仅仅用来观测测试效果的数据。而训练集和评估集则牵涉到下面的知识了。
因为在实际的训练中,训练的结果对于训练集的拟合程度通常还是挺好的(初试条件敏感),但是对于训练集之外的数据的拟合程度通常就不那么令人满意了。因此我们通常并不会把所有的数据集都拿来训练,而是分出一部分来(这一部分不参加训练)对训练集生成的参数进行测试,相对客观的判断这些参数对训练集之外的数据的符合程度。这种思想就称为交叉验证(Cross Validation)。
来源百度:
交叉验证_百度百科
https://baike.baidu.com/item/%E4%BA%A4%E5%8F%89%E9%AA%8C%E8%AF%81/8543100?fr=aladdin



我们应用和看到的就是Public 的部分







相关文章:

Blender三维建筑场景动画制作学习教程

一起在Blender中创建一个三维低多边形场景动画 你会学到什么 这门课程是为那些喜欢在工作流程中成长的艺术家设计的 初学者 想学会让自己的资产活起来的艺术家。 希望扩展其技能集的游戏开发人员。 MP4 |视频:h264,1280720 |音频:AAC,44.1 KHz&#x…

springcloud 组件_SpringCloud组件mica 2.0.5发布,添加对sentinel、undertow指标收集

一、mica(云母)mica 由如梦技术内部的 lutool(撸秃) 演变而来。lutool 诞生于 2017 年,受 jhipster 启发逐步形成一个微服务的核心集。因 lutool 名称与功能不太符合,故在2019年开源时将其改名为 mica&…

access order by 判断是否除数为0

order by IIF(dz>0,yj/dz,0) desc转载于:https://www.cnblogs.com/slyzly/p/5379482.html

vm无网络解决方法

编辑-虚拟网络编辑器-还原默认

十五天精通WCF——第八天 对“绑定”的最后一点理解

转眼已经中断10几天没有写博客了,也不是工作太忙,正好碰到了端午节,然后最近看天津台的爱情保卫战入迷了。。。太好看了,一直都是回味无穷。。。而且 涂磊老师话说的真是tmd的经典,然后就这样耽搁了,好了&a…

2018年目标

2018年又一个新的开始2018年的学习目标: (1)每天学习算法和Python。尝试用Python写出不同的算法 (2)每天完成一篇CSDN专栏大数据相关 (3)每天进步一点点的打卡完成 (4)集…

GameMaker Studio从头开始学习设计和开发3款游戏

从头开始学习设计和开发3款游戏(无需经验) 你会学到什么 如何塑造令人敬畏的角色 如何使用GameMakerStudio 2 视频游戏编程 基本二维动画 如何查找和修复bug 如何给你的游戏编故事 从哪里获得游戏资产(免费) 如何添加声音效果 如何发展你的游戏理念 游戏设计力学 如何制作有趣…

商淘多b2b2c商城系统怎么在个人电脑上安装_社交电商系统开发是否有价值?

​电商平台已经呈现出平稳发展之势,再加上近年来星期的社交,让社交电商平台蓬勃发展,不仅是小平台,京东、唯品会、小米等纷纷有了自己的社交电商平台,说明了社交电商是发展的大趋势,开发社交电商系统也是创…

AngularJS中的按需加载ocLazyLoad

欢迎大家讨论与指导 : ) 初学者,有不足的地方希望各位指出 一、前言 ocLoayLoad是AngularJS的模块按需加载器。一般在小型项目里,首次加载页面就下载好所有的资源没有什么大问题。但是当我们的网站渐渐庞大起来,这样子的加载策略让…

简单介绍互联网领域选择与营销方法

在我看来,互联网领域的选择是“安家”,而营销方法的不同则表现了“定家”的方式多种多样,只有选对了,“家”才得以“安定”。 下面不妨简单总结一下互联网近年来的热点领域和经典营销方法。 一、热点领域 人工智能 人工智能&#…

ZZCustomAlertView - 一个高度自定义的iOS模态弹窗

2019独角兽企业重金招聘Python工程师标准>>> 这是一个可以高度自定义的iOS模态弹窗 (modal alert view)。 项目地址:https://github.com/zzdjk6/ZZCustomAlertView Github 项目里包含一个 Example 的 Demo 示例。 使用Cocoapod: pod "ZZ…

2018-3-1 算法学习部分

1:算法的Python实现 数据结构以及算法的基本概念 通过小甲鱼论坛中的数据结构部分进行理解基本的概念的自我理解: 数据结构官方:数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题…

深度学习硬件基础:CPU与GPU

CPU:叫做中央处理器(central processing unit)作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。[^3]可以形象的理解为有25%的ALU(运算单元)、有25%的Control(控制单元)、50%的Cache(缓存单元)GPU:叫做图形处理器。

云计算的三种服务模式:IaaS、PaaS和SaaS

租赁 IaaS 云服务,对租户而言,最大优点是其灵活性,由租户自己决定安装什么操作系统、需不需要数据库且安装什么数据库、安装什么应用软件、安装多少应用软件、要不要中间件、安装什么中间件等,相当于购买了一台计算机,要不要使用、何时使用以及如何使用全由自己决定。① 相比于 IaaS 云服务提供商,PaaS 云服务提供商要做的事情增加了,他们需要准备机房、布好网络、购买设备、安装操作系统、数据库和中间件,即把基础设施层和平台软件层都搭建好,然后在平台软件层上划分“小块”(习惯称之为容器)并对外出租。

国内第三方移动推送对接调查:Android、IOS、Flutter,各种云推送、个推、极光、统一推送联盟

第三方移动推送对接,刚开始是移动端发起的。在开会讨论这个对接时,心里突然很迷茫,为什么要做第三方移动推送对接?我们自己为什么不能做移动推送?话说,项目里目前所使用的推送就是自己做的。但是在App离线情况下,消息就收不到了。想起来了,这是最最重要的问题,是为了在离线的情况下,App还能收到通知和消息。如果不是因为这个,这个对接可以不做。因为手机端的app层不出穷太多了,为了给手机省电,用户会主动把运行在前端的app给咔嚓掉…虽然咔嚓掉,但是在有信息的情况下,用户还是希望能够收到信息。

Blender着色器纹理材质创作教程含源文件 Shader Forge

本Blender视频课程是一个正在进行的关于为Cycles渲染引擎构建材质(着色器)的系列。只要有足够的时间和努力,物质性就能给CG场景注入这样的生命。 本课程是一个正在进行的关于为Cycles渲染引擎构建材质(着色器)的系列。有了足够的时间和精力,高质量的阴影…

Android 5.0新特性之沉浸式状态栏

参考资料:http://laobie.github.io/android/2016/03/27/statusbar-util.htmlhttp://laobie.github.io/android/2016/02/15/status-bar-demo.htmlhttp://www.jianshu.com/p/f0a0efe5d26f将状态栏颜色和顶部导航栏颜色保持一致从而达到融合的效果,我们将这…

数字信号处理实验三用fft对信号作频谱分析_机器学习中的音频特征:理解Mel频谱图...

如果你像我一样,试着理解mel的光谱图并不是一件容易的事。你读了一篇文章,却被引出了另一篇,又一篇,又一篇,没完没了。我希望这篇简短的文章能澄清一些困惑,并从头解释mel的光谱图。信号信号是一定量随时间…

【Kaggle Learn】Python 1-4

【Kaggle Learn】Python https://www.kaggle.com/learn/python 一. Hello, Python A quick introduction to Python syntax, variable assignment, and numbers spam_amount 0 print(spam_amount)# Ordering Spam, egg, Spam, Spam, bacon and Spam (4 more servings of Spam)…

svn中的ignore

首先,svn GUI菜单右键的ignore功能,写的模模糊糊,网上也没啥人给出清晰的解释,stackoverflow推荐用命令行控制 SVN有3中方法配置ignore 1.配置文件 C:\Users\{you}\AppData\Roaming\Subversion\config 这个只是本地客户端端, 2.svn:ignore 如果带recursively,在执行…

2018-3-2线性表

2018-3-2 来源小甲鱼论坛: ★第八讲 线性表3 ★,数据结构与算法,技术交流区,鱼C论坛 - Poweredby Discuz! http://bbs.fishc.com/forum.php?modviewthread&tid96295&ctid1041 1. 线性表(List)的定义: 由零个或多个数…

元宇宙开发:你在虚幻引擎中的第一个虚拟现实游戏

了解如何开发零编程背景的Oculus Quest游戏 你会学到什么 为Oculus Quest构建应用程序 设计和开发虚拟现实游戏 在虚幻引擎中工作 使用材料和纹理 优化内容,实现移动和虚拟现实游戏的快速性能 流派:电子学习| MP4 |视频:h264,1280720 |音频:AAC&#x…

虚拟机访问svn服务器超时_SVN卡顿原因及简单修复方法

项目中用SVN,使用过程中尤其时访问SVN浏览器的时候经常卡顿,这个时间累积起来很是浪费,所以找个机会从各个方面分析了一下卡顿原因,也总结了一些修复经验。硬件问题查看电脑配置是否SSD双硬盘,如果是,查看设…

前端页面——Cookie与Session有什么区别

我们在实际生活中总会遇到这样的事情,我们一旦登录(首次输入用户名和密码)某个网站之后,当我们再次访问的时候(只要不关闭浏览器),无需再次登录。而当我们在这个网站浏览一段时间后,…

【Kaggle Learn】Python 5-8

五. Booleans and Conditionals Using booleans for branching logic x True print(x) print(type(x)) True <class bool> ①Booleans Python has a type bool which can take on one of two values: True and False. ②Comparison Operations a b, and, or, not等等 …

hdu 2795 段树--点更新

http://acm.hdu.edu.cn/showproblem.php?pid2795 在第一和第三多学校都出现线段树&#xff0c;我在比赛中并没有这样做。&#xff0c;热身下&#xff0c;然后31号之前把那两道多校的线段树都搞了&#xff0c;这是一道热身题 关键是建模&#xff1a; 首先一定看清楚题目构造的场…

2018-3-3 论文(网络评论中非结构化信息的表示与应用研究)笔记一

文章立脚点&#xff1a; 大量网络评论的出现&#xff0c;使得产品制造商或消费者很难跟踪己购产品用户的意见和建议&#xff0c;这就给他们的决策造成了额外的困难。 文章思路; 将网络评论中的非结构化信息处理成结构化信息 文章的总体的脉络 首先研宄评论分词、词性标注…

Blender中的大师级3D环境场景制作学习教程

你需要在一个地方学习的一切 在本课程中&#xff0c;您将学习Blender中景观创建的每一个重要工作流程&#xff0c;而无需使用任何付费附加组件或资产。 你将学习如何创造山脉、海洋、森林、沙漠、云层和天气影响。无需搜索描述特定技术或工作流程的在线视频–您将在一门课程中…

git diff 比较文件_使用Python创建你自己的diff工具

为什么我需要自己的diff工具&#xff1f;我经常使用git跟踪我的编码项目、文章、业务工作等等。git的一个美妙之处在于&#xff0c;你可以通过简单地使用其内置的diff功能来轻松地比较你的工作的不同状态。要使用这个功能&#xff0c;你只需要满足两个约束:首先&#xff0c;你需…

Oracle开发:normal ,sysdba,sysoper区别

Oracle将用户分成两类&#xff1a;【system】和【sys】 【system】用户只能用normal身份登陆em。(可以看成公司的普通成员)【sys】用户具有“SYSDBA”(可以看成公司的CEO)或者“SYSOPER”权限(可以看成公司的运营主管)&#xff0c;登陆em也只能用这两个身份&#xff0c;不能用n…