当前位置: 首页 > 编程日记 > 正文

【转】对random_state参数的理解

转自:https://blog.csdn.net/az9996/article/details/86616668


在学习机器学习的过程中,常常遇到random_state这个参数,下面来简单叙述一下它的作用。
作用:控制随机状态。

原因:为什么需要用到这样一个参数random_state(随机状态)?

在此先简单罗列三种情况:
1、在构建模型时:

forest = RandomForestClassifier(n_estimators=100, random_state=0)
forest.fit(X_train, y_train)

2、在生成数据集时:

X, y = make_moons(n_samples=100, noise=0.25, random_state=3)

3、在拆分数据集为训练集、测试集时:

X_train, X_test, y_train, y_test = train_test_split(
cancer.data, cancer.target, stratify=cancer.target, random_state=42)

如果不设置random_state的话会怎样?
例如1中,每次构建的模型是不同的。
例如2中,每次生成的数据集是不同的。
例如3中,每次拆分出的训练集、测试集是不同的。

之所以会这样,是因为模型的构建、数据集的生成、数据集的拆分都是一个随机的过程。

如果你希望结果可以重现,固定random_state是非常重要的。

对于随机森林这个模型,它本质上是随机的,设置不同的随机状态(或者不设置random_state参数)可以彻底改变构建的模型。
对于数据集的生成,它本质上也是随机的,设置不同的随机状态(或者不设置random_state参数)可以彻底改变生成的数据集。
对于数据集的拆分,它本质上也是随机的,设置不同的随机状态(或者不设置random_state参数)可以彻底改变拆分的结果。

固定random_state后,每次构建的模型是相同的、生成的数据集是相同的、每次的拆分结果也是相同的。

总结:对于那些本质上是随机的过程,我们有必要控制随机的状态,这样才能重复的展现相同的结果。
如果,对随机状态不加控制,那么实验的结果就无法固定,而是随机的显现。

修改(2019年3月9日17:44:06)

比喻的说一下,也不知道准不准确。
一个容器中放置一定量的沙子,每次用手去抓沙子的时候,抓取的结果会受到抓取的力度、一只手抓还是两只手抓、手是干的或湿的等诸多因素的影响(将影响因素定为A={a,b,c,d,e,f,……})。

固定random_state后,每次抓取沙子时的影响因素将被固定为具体的某一组,这样每次抓取的沙子就具有了相同的状态。

转载于:https://www.cnblogs.com/xianhan/p/10644873.html

相关文章:

关于项目总结一下

最近在做两很多事情,总结一下 1、MySQL使用需要注意的地方1) 存储引擎选择InnoDB,在高并发下读写有很好的表现2) 数据合理分表分区,均衡各数据库服务器的负载3) 适当作数据的冗余,便于在cache失效时的快速恢复 2、Redis使用需要注…

鸿蒙系统能内测吗,鸿蒙系统内测用户:使用体验已经超越ios

首先,鸿蒙流畅度堪比iOS,如同德芙巧克力一样非常丝滑,各种界面切换毫无卡顿。鸿蒙是万物互联的基础,在与其他设备联动上,使用了freebuds pro和magic wathc2,状态栏就能直接切换耳机,非常顺畅&am…

19.04.02笔记

用户权限:su 切换用户账户格式:【su 用户名 】【su】 切换到root【su root】 切换到root【su -】 切换到root用户 同时切换到root目录添加组:【groupadd 组名】 添加组 需要用户权限删除组【groupdel 组名】 删除组 需要用户权限和清空组…

VS2013自带的Browser Link功能引发浏览localhost网站时不停的轮询

浏览localhost网站时候不管你打开那个页面它都会不停的轮询。据悉这是VS2013自带的Browser Link功能,里面用到SignalR机制什么是Browser Link功能,什么是SignalR机制大家可以没事去百度了解一下。Browser Link功能讲解地址:http://www.cxyclu…

编译型语言和解释型语言(转载)

在具体计算机上实现一种语言,首先要确定的是表示该语言语义解释的虚拟计算机,一个关键的问题是程序执行时的基本表示是实际计算机上的机器语言还是虚拟机的机器语言。这个问题决定了语言的实现。根据这个问题的回答,可以将程序设计语言划分为…

魅族手机使用鸿蒙系统,魅族宣布接入华为鸿蒙系统,这应该是黄章最正确的决定...

安卓能有现在的成就一切源于苹果之外其它所有品牌都在使用,俗话讲“众人拾柴火焰高”就是这个道理。相对来讲华为鸿蒙要想做大做强必须有其它品牌支持才可以,如果华为自己一家使用是无法做到与苹果的iOS、谷歌的安卓相抗衡的。这就是为什么华为鸿蒙正式确…

(转)互斥对象锁和临界区锁性能比较 .

在Win32平台上进行多线程编程,常会用到锁。下边用C实现了互斥对象(Mutex)锁和临界区(CRITICAL_SECTION)锁,以加深理解和今后方便使用。代码已在VS2005环境下编译测试通过。 Lock.h [cpp] view plaincopypri…

CentOS6.5 下sciki-learn numpy scipy 的安装

CentOS6.5 下sciki-learn numpy scipy 的安装软件安装CentOSPython之前用的一直是CentOS 7, 后来觉的软件安装太麻烦就改到了Ubuntu, 这些Python 的包在Ubuntu下安装几乎是无脑的,用apt-get 安装 Ipython 的时候会自动下载numpy, scipy 和 ma…

2021年甘肃省副高考试成绩查询,2021年甘肃卫生资格考试成绩查询-中国卫生人才网...

国家卫生资格考试网为您发布 2021年甘肃卫生资格考试成绩查询-中国卫生人才网,同步中国卫生人才网信息:2021甘肃卫生资格成绩查询。更多关于卫生资格成绩,卫生资格考试,2021卫生资格考试,国家卫生资格成绩查询的信息内容,请关注国家卫生资格考…

OWIN初探(转)

什么是 OWIN ? OWIN 的全称是 "Open Web Interface for .NET", OWIN 在 .NET Web 服务器和 .NET Web 应用之间定义了一套标准的接口, 其目的是为了实现服务器与应用之间的解耦, 鼓励为 .NET Web 应用开发简单模块。 OWI…

JavaMail学习笔记(一)、理解邮件传输协议(SMTP、POP3、IMAP、MIME)

电子邮件需要在邮件客户端和邮件服务器之间,以及两个邮件服务器之间进行传递,就必须遵循一定的规则,这些规则就是邮件传输协议。SMTP协议定了邮件客户端与SMTP服务之间,以及两台SMTP服务器之间发送邮件的通信规则;POP3…

怎样设计一个商城项目?

这两天公司要做一个商城项目,网上搜了很多没找到完整的、有结构体系的资料,可能这件事本身并不难,但是对新手非常不友好,所以我借机把这些碎片化的资料尝试整理成一个有体系的资料,希望能对你有帮助。资料来源包括&…

台式计算机刚换的显示屏怎么设置,台式机怎么样切换显示器

我的台式机是双显示器,该怎么样去切换呢?下面由小编给你做出详细的台式机切换显示器方法介绍!希望对你有帮助!台式机切换显示器方法一:需要用到的硬件:1、支持双视频信号输出的显卡。如一块显卡支持VGA输出,又同时支持DVI输出。2…

c# html文本编辑器,C#实现简单文本编辑器

本文实例为大家分享了C#实现简单文本编辑器的具体代码,供大家参考,具体内容如下建立一个窗体文件,实现对文件的编辑保存和对txt文件的打开界面设计:程序源代码://form1.csusing System;using System.Collections.Gener…

spark1.4加载mysql数据 创建Dataframe及join操作连接方法问题

首先我们使用新的API方法连接mysql加载数据 创建DF import org.apache.spark.sql.DataFrame import org.apache.spark.{SparkContext, SparkConf} import org.apache.spark.sql.{SaveMode, DataFrame} import scala.collection.mutable.ArrayBuffer import org.apache.spark…

新机器学习库TensorFlow Privacy问世:旨在保护敏感数据

在最近的一篇博文中,TensorFlow宣布推出TensorFlow Privacy。这是一个开源库,它允许研究人员和开发人员构建具有强大隐私保护功能的机器学习模型。基于强大的数学确定性(mathematical guarantees),使用本库可以确保用户…

HDU 1596 find the safest road (Floyd)

题目链接 本来对弗洛伊德很没信心&#xff0c;1000个城市&#xff0c;还好&#xff0c;还是过了&#xff0c;最裸的有4000ms&#xff0c;因为是无向图加了下优化&#xff0c;3000ms&#xff0c;这个。。。。 #include <stdio.h> #include <string.h> double p[1001…

PHP学习 文件操作函数的应用--简单网络留言模板

1 <?php2 /**3 网络留言板模式4 主要运用到的函数有5 fopen fclose flock fwrite fread explode list6 */7 ?>8 <meta http-equiv"Content-Type" content"text/html;charsetutf-8">9 <?php error_reporting(E_ALL &…

刷过一题之黑魔法师之门

经过了16 个工作日的紧张忙碌&#xff0c;未来的人类终于收集到了足够的能源。然而在与Violet星球的战争中&#xff0c;由于Z 副官的愚蠢&#xff0c;地球的领袖applepi 被邪恶的黑魔法师Vani 囚禁在了Violet 星球。为了重启Nescaf这一宏伟的科技工程&#xff0c;人类派出了一支…

浅谈Javascript事件模拟

事件是用来描述网页中某一特定有趣时刻的&#xff0c;众所周知事件通常是在由用户和浏览器进行 交互时触发&#xff0c;其实不然&#xff0c;通过Javascript可以在任何时间触发特定的事件&#xff0c;并且这些事件与浏览器创建的事件是相同的。这就意味着会有适当的事件冒 泡&a…

程序员成熟的几个标志

转载自&#xff1a;http://blog.csdn.net/linux_loajie/article/details/7698551 程序员成熟的标志 程序员在经历了若干年编程工作之后&#xff0c;很想知道自己水平到底如何&#xff1f;自己是否已经成为成熟的程序员&#xff1f;虽然程序员会对自己有一个自我评价&#xff0c…

云平台屡次停摆,核心系统事故频发?您的运维系统该升级了!

3月3日凌晨&#xff0c;阿里云出现宕机故障&#xff0c;受宕机故障影响&#xff0c;华北不少互联网公司 APP、网站纷纷瘫痪&#xff0c;一大波程序员、运营和运维不得不从被窝里爬起来干活。网友“上海蓝盟网络夏立成”调侃&#xff0c;“阿里云一年一宕机&#xff0c;今年特别…

yii1框架,事务使用方法

Yii1框架事务操作方法如下&#xff1a; $transaction Yii::app()->db->beginTransaction();//创建事务 $transaction->commit();//提交事务 $transaction->rollback();//回滚事务下面使用try&#xff0c;throw&#xff0c;catch配合使用事务&#xff1a; 1 // 以下…

竖直菜单 html,jQuery实现的网页竖向菜单效果代码

本文实例讲述了jQuery实现的网页竖向菜单效果代码。分享给大家供大家参考。具体如下&#xff1a;这是一款基于jQuery实现竖向的网页菜单代码&#xff0c;可折叠展开的二级网页菜单&#xff0c;修改一下可用在后台管理中&#xff0c;显示在左侧的那种管理菜单。jquery加入后方便…

可以检验计算机配置的游戏软件,检测游戏配置的软件-有没有自己检验电脑配置是否符合游戏要求配置 – 手机爱问...

2018-03-28电脑配置是否够好如果楼主你这个配制已经配了的话就没什么好说的了 如果你没配 今天是别人给你写的话 那就千万别配 因为根本是一套垃圾东西 给你介绍一套 CPU&#xff1a;5200 够了 主板&#xff1a;七彩红 770 370 比华硕M2N68 400 NF芯片的划算 还可以组成3A平台 …

Linux实战教学笔记32:企业级Memcached服务应用实践

一&#xff0c; Memcached介绍 1.1 Memcached与常见同类软件对比 &#xff08;1&#xff09;Memcached是什么&#xff1f; Memcached是一个开源的&#xff0c;支持高性能&#xff0c;高并发的分布式内存缓存系统&#xff0c;由C语言编写&#xff0c;总共2000多行代码。从软件名…

嵌入式开发入门(2)

开发平台和硬件设备。我给的只是一种入门知识&#xff0c;具体如何应用请自助思考。所以请不要想着和我搭建同样的硬件平台。你要学习的是入门知识&#xff0c;换个芯片你一样可以这样做。 Ps&#xff1a;如果你想搭建试验平台直接买STM32F103的开发板&#xff0c;淘宝一把一把…

计算机四级网络工程题库,2016计算机四级网络工程师题库

2016计算机四级网络工程师题库一、选择题1、 以下关于OSPF协议技术特征的描述中&#xff0c;哪个是错误的?A.OSPF协议使用层次结构的区域划分B.它将一个自治系统内部划分成若干区域与主干区域(backbone area.C.主干区域连接多个区域&#xff0c;主干区域内部的路由器叫做主干路…

英语计算机作文初中.,初中英语作文:电脑游戏

Computer Games电脑游戏Computer games is a hot topic nowadays. Some people hold that it is bad. And others hold that it is good. In my view, whether good or bad is determined by the players.现在&#xff0c;电脑游戏是一个非常火的话题。一些人认为电脑游戏是不好…

计算机英语缩写AGP,IT行业常用计算机缩略语

IT行业常用计算机缩略语导语&#xff1a;信息技术缩写为IT&#xff0c;是主要用于管理和处理信息所采用的各种技术的总称。下面是YJBYS小编收集整理的IT行业常用计算机缩略语&#xff0c;希望对你有帮助!ADC     Analog-to-Digital Conventer      模数转换器ADO  …