用 Python 详解《英雄联盟》游戏取胜的重要因素!
作者 | DeepHub IMBA
责编 | 王晓曼
介绍
在过去的几年里,电子竞技社区发展迅速,曾经只是休闲娱乐的电子竞技产业,到2022年有望创造18亿美元的收入。
虽然在这个生态系统中有很多电子游戏,但很少有游戏像《英雄联盟》那样成为社区的主要元素,该游戏在2019年世界锦标赛期间吸引了超过1亿的独立观众。
《英雄联盟》于2009年底发行,是一款免费的多人在线战斗竞技场(MOBA)视频游戏,由 Riot Games 公司开发,这款游戏在早期就产生了广泛的竞争场景,2011年的第一届世界冠军创造了约160万观众。
随着 Riot 开始了解如何改变才能使游戏更具竞争性和趣味性,这款游戏在受欢迎程度和可玩性方面都有所提高。
在《英雄联盟》的比赛中,两队各有五名玩家,每一队都控制着一个独特的角色或“冠军”,当其中一队位于其基地深处的 Nexus 被摧毁时,比赛就会结束。
在这个过程中,一个团队可以实现很多目标,比如摧毁炮塔,杀死中立的怪物,比如龙和男爵,以获得整个团队的增益,等等。
有些目标,如摧毁至少五个炮塔和一个兵营,是赢得游戏所必需的,而其他目标,如获得第一滴血,是有益的,但不是必须的。
通过这个项目,我想更好的了解这些目标中哪一个是赢得英雄联盟游戏最重要的。就此而言,我提出的问题如下:
英雄联盟最重要的获胜条件是什么?
收集数据
我首先申请了一个使用 Riot Developer Portal 的应用程序,在我的应用程序被接受后,我浏览了 api 列表,以了解我可以请求的数据类型。
不幸的是,没有一种直接的方法可以从一个区域中取出最后X个排名的匹配项,所以我必须找到一种方法来解决这个问题。
我的解决方案是使用召唤者名称列表(用户名)来为每个玩家生成最近的比赛列表。通过 Python 包 Riot-Watcher 的调用,获取了差不多10000行的数据与五个地区最新联赛比赛的前100名玩家的数据。
乍一看,DataFrame 看起来是这样的:
在前7列中,0表示“False”,1表示“True”,而在后面的列中,单元格中编码的数据表示事件发生的次数。每行都包含了一场排位比赛中的一支队伍的统计数据。例如,在第一排,没有获得任何目标的团队首先输掉了整个比赛。
探索性数据分析热图和主成分分析
首先,我发现91%的获胜团队摧毁了第一个兵营,80%杀死了第一个男爵,70%摧毁了第一个塔,63%杀死了第一条龙,59%的获胜团队以第一滴血开始游戏。
现在看来,最重要的获胜条件是摧毁第一个兵营,这是有意义的,因为摧毁一条线路的兵营会给他们的基地带来压力,并允许对方拥有更多的地图控制。
接下来,我可视化了数据集中各列之间的相关性:
我还为我的数据中所代表的每个独立地区找到了相同的关联热图,以比较不同地区之间的关联,希望能注意到游戏风格的一些差异。
一般来说,相关矩阵看起来非常相似。一个可能的原因是,我的数据包含了每个地区最好的玩家的比赛,其中许多人是职业选手。
因此,由于良好的游戏实践在竞争性社区中是一致的,所以我的数据中所代表的匹配涉及到那些在每一款游戏中顶级玩家,而这些玩家相对于每个区域中排名较低的玩家来说是相似的。
我现在很想知道数据中的方差是如何用较少的特征来解释的,而不是我用来预测游戏结果的10个特征。在这种程度上,我进行了主成分分析,以了解我可以将数据简化成多少特征,同时保留大部分的方差:
十个预测列中超过80%的方差可以用一半的特征量来解释。这确实很有趣,通过将每个组件与原始数据集的列关联起来,我希望了解在解释数据的差异时哪些特性是最重要的,这可以帮助我弄清楚哪些列对一个团队是否会获胜最关键。
用于生成上述热图的组件来自一个包含六个PCA对象,因为我希望这些组件能够解释数据中超过90%的差异。看来推塔,摧毁兵营,以及一个团队是否摧毁了第一个兵营在确定方差最重要的特征数据,第一个组件解释40%的方差和三个上述列加权最该组件。
重申一下我在这一点上的领悟:
从我的关联热图来看,无论一个团队是否摧毁了第一个兵营,一个团队推掉了多少塔,以及一个团队摧毁了多少兵营都与获胜有最高的相关性。
从我的 PCA 分析来看,团队是否摧毁了第一个兵营,团队摧毁了多少塔,以及团队摧毁了多少兵营在解释数据中的差异方面发挥了最大的作用。
使用逻辑回归进行数据建模
我使用了 Logistic 回归模型来理解《英雄联盟》排名比赛的获胜条件。我的过程是首先将我的数据分割成一组特征和一组目标,其中我的特征是除 ‘win’ 和 ‘region’列 之外的所有列,我的目标是‘win’列。
然后我将我的数据分解为一个列集和一个测试集,通过 Logistic 回归模型进行运行,并检查分类报告和混淆矩阵,确保有较强的预测能力。当逻辑回归模型在整个数据集上运行时,模型的精度和召回率分别为。86和。85。
从这里开始,我对只包含一个区域的数据子集进行逻辑回归,比如只在 NA、BR 等中进行的匹配,并在一个 Pandas 数据模型中记录模型的系数。这个数据图被可视化了,所以我可以比较不同的区域:
回归系数描述预测变量和目标变量之间的关系。例如,当我们看上面的一血预测变量时,第一个拿到一血的队伍是对比赛结果的适度预测,因为第一个拿一血的队伍更有可能获胜。
另一方面,峡谷先驱的击杀实际上是在相反的方向上相关的(除了EUNE),并且获得更多峡谷先驱击杀的队伍更有可能输掉。
通过这个分析过程,我了解了哪些专栏更能预测胜利,帮助我回答了关于《英雄联盟》中获胜条件的问题。
结论
通过我的项目,我得出以下结论:
根据我的逻辑回归模型,按照最大到最小的顺序,第一个兵营,第一个塔,塔摧毁是数据集中最重要的获胜条件(这是推塔游戏)。
根据我的关联热图,从最大到最小,塔摧毁,第一个兵营,兵营摧毁数是数据集中最重要的获胜条件(这是推塔游戏)。
虽然获得第一个 baron 的 NA 和 EUW 团队更有可能获胜,但随着杀死的baron 数量的增加,这些地区的团队更有可能失败。
与其它地区相比,在 NA 地区的团队更有可能赢得第一只龙,这一事实或许表明在 NA 地区的游戏更倾向于龙的爱好者和围绕龙的战斗滚雪球式的游戏(当一个团队在游戏中扩大一个小优势以赢得胜利)。
KR游戏并没有受到一个特性的不均衡影响。这可能表明KR的队员比其它地区的队员更了解如何在劣势中有戏,这促使团队比其它地区的团队更经常地赢得组合目标。
本文源代码:https://github.com/ankushbharadwaj/league-of-legends-win-conditions
译者注:这个模型没有使用 “region”列作为训练参数使用国服数据训练可能是个败笔,毕竟处理祖安的玩家数据可能需要更多的自然语言处理技术提取聊天的特征,这才是祖安人胜利的关键!
声明:本文为 CSDN 博主「deephub」的翻译文章,版权归作者所有。
原文:https://blog.csdn.net/m0_46510245/article/details/108116199
更多精彩推荐
Get了!用Python制作数据预测集成工具 | 附代码
赠书 | 人工智能识万物:卷积神经网络的前世今生
万字长文总结机器学习的模型评估与调参 | 附代码下载
“Talk is cheap, show me the code”你一行代码有多少漏洞?
科普 | 定义 Eth2.0 中的验证者质量
相关文章:

用户输入一个数字,找到所有能够除尽它的数的总个数
想不到我这个小学生也会做 <!DOCTYPE html><html lang"en"><head> <meta charset"UTF-8"> <title>Document</title> <script type"text/javascript"> //用户输入一个数字,找到所有能够除…

如何在DataGrid里面使用动态图形表示数字
作者: cuike519的专栏 http://blog.csdn.net/cuike519/本文将要简单的介绍如何在DataGrid里面用图形表是一个数字,听起来好象要用到GUI的编程,其实不然,如果你读完全文你就会发现其实很简单,只是一个“小把戏”而已…

替换 RHEL5的yum源为CentOS5源,亲测线上系统可用
最近安装nagiospnp,各种依赖包啊。rrdtool肿么装的这么费劲,后来实在扛不住了,还是修改rhel的源吧,把yum源搞成centos的不就ok了!哈哈。然后就从网上一顿猛搜,发现“Ayou”老师的文章很靠谱,很有…
如何使用 Python 构建推荐引擎?
作者 | Craig Kerstiens译者 | 弯月,编辑 | 王晓曼头图 | CSDN 下载自东方IC来源 | CSDN(ID:CSDNnews)我非常喜欢数据。数据可以告诉你用户在干什么,还可以提供各种深刻的见解。数据应用的一个方面就是根据历史记录或用…

LVM 类型的 Storage Pool - 每天5分钟玩转 OpenStack(8)
http://www.cnblogs.com/CloudMan6/p/5277927.html LVM 类型的 Storage Pool - 每天5分钟玩转 OpenStack(8)LVM 类型的 Storage Pool不仅一个文件可以分配给客户机作为虚拟磁盘,宿主机上 VG 中的 LV 也可以作为虚拟磁盘分配给虚拟机使用。不过…

.NET中的密码学--对称加密
作者:未知 介绍 在.NET之前,使用非托管的Win32APIs加密解密数据是一件非常痛苦的事情。为了这个加密解密的目的,.NET配置了一组类(和命名空间)。现在你有很多类可以使用每种不同的算法保护你的数据。在.NET里面Crypt…
哪种编程语言最适合初学者?
经常听到有人在说:“现在技术迭代越来越快,程序员的压力更大了,30岁之后的程序员就不好找工作了......”,这不乏很多人在故意贩卖焦虑,但是也会引起我们对自己发展的思考。尤其刚入行的程序员会迷茫,会思考…

地址本在不同手机间的迁移
更换手机时最烦人的莫过于迁移地址本了,近来又迎来了换工作,换手机,先将地址本迁移的方法总结如下: 1)通用方法 功能手机上不能自己写程序的话,迁移起来没有什么好办法,只能先把地址本复制到SIM…

关于flume配置加载(二)
为什么翻flume的代码,一方面是确实遇到了问题,另一方面是想翻一下flume的源码,看看有什么收获,现在收获还谈不上,因为要继续总结。不够已经够解决问题了,而且确实有好的代码,后续会继续慢慢分享…
为什么深度神经网络这么难训练?| 赠书
导读:本文内容节选自《深入浅出神经网络与深度学习》一书,由Michael Nielsen所著,他是实验媒体研究工作室的联合创始人,曾是 YC Research 的 Research Fellow。。本书深入了讲解神经网络和深度学习技术,侧重于阐释深度…

dhcp 搭建
自带rpm包安装:# mount /dev/cdrom /media 挂载 # cd /media/Server/ 进入目录 # rpm -ivh dhcp-3.0.5-18.el5.i386.rpm 安装DHCP # cp /usr/share/doc/dhcp-3.0.5/dhcpd.conf.sample /etc/dhcpd.conf …

锦上添花DataGrid!
作者: cuike519的专栏 http://blog.csdn.net/cuike519/我们知道如果datagrid的宽度比较长那么使得我们很难分清楚行数据,也就是很容易 使我们看错行,我想如果当我们的鼠标移动到datagrid的行上,他可以清楚的显示给 我们就好了…

linux服务器优化1.0版
1.服务器修改IP vim /etc/sysconfig/network-scripts/ifcfg-eth12.修改dns服务器 vim /etc/resolv.conf 3.关闭selinux vim /etc/selinux/config 4.修改主机名iZ118z08 vim /etc/sysconfig/network5.禁用control-alt-delete vim /e…

给DataGrid添加确定删除的功能
给DataGrid添加确定删除的功能DataGrid的功能我想大家是知道的,我在实际的应用中遇到如下的问题,客户要求在删除之前做一次提示。类 似于windows。首先我们都知道DataGrid支持删除的功能,我们可以向DataGrid里面添加删除列就可以实现&#x…
操纵神经元构造后门,腾讯朱雀实验室披露AI模型新型攻击手法
近日,在第19届XCon安全焦点信息安全技术峰会上,腾讯朱雀实验室首度公开亮相。这个颇有神秘色彩的安全实验室专注于实战攻击技术研究和AI安全技术研究,以攻促防,守护腾讯业务及用户安全。会上,腾讯朱雀实验室高级安全研…

工程师进阶之路(四)
转载自 量子恒道官方博客 地址:http://blog.linezing.com 如何和“老板”沟通 我们是一线工程师的时候,和我们的直接技术管理者沟通是非常容易的。我们的技术架构、代码风格、系统扩展性、工程化全局考虑就是我们赢得信任和信赖的名片。但是随着我们的…

Hadoop API文档地址
经常需要查阅,做一下笔记 http://hadoop.apache.org/docs/ http://hadoop.apache.org/docs/current1/api/ http://hadoop.apache.org/docs/current2/api/

两个FTP对传文件
2019独角兽企业重金招聘Python工程师标准>>> #!/bin/bash ftp -n<<! open hostname user username password binary cd /FTP_A_Directory lcd /tmp/tmpSave prompt mget * close bye ! ftp -n<<! open hostname user username password binary cd /…
全国大学生数学建模竞赛中,哈工大被禁用MATLAB
整理 | 屠敏出品 | AI科技大本营(ID:rgznai100)AK47 VS “小米加步枪”同台竞技,最终会有什么样的结果?目前我们尚未可知,但是这样的“竞赛”却在真实上演中。近日,在全国大学生数学建模竞赛中&…

JDK NIO编程
我们首先需要澄清一个概念:NIO到底是什么的简称?有人称之为New I/O,因为它相对于之前的I/O类库是新增的,所以被称为New I/O,这是它的官方叫法。但是,由于之前老的I/O类库是阻塞I/O,New I/O类库的…

ASP.NET ViewState 初探
Susan Warren Microsoft Corporation 与刚接触 ASP.NET 页面的开发人员交谈时,他们通常向我提出的第一个问题就是:“那个 ViewState 到底是什么?”他们的语气中流露出的那种感觉,就象我来到一家异国情调的餐馆,侍者端…

[emuch.net]MatrixComputations(1-6)
matrixComputation转载于:https://www.cnblogs.com/stoneresearch/archive/2012/06/24/4336678.html
身为面向对象编程、移动计算机之父的他,为何说“计算机革命还没真正到来”?...
作者 | 年素清责编 | 李雪敬出品 | 程序人生(ID:coder_life) 艾伦凯(艾伦 Kay)是近代计算机革命先驱之一,他最早提出了“面向对象编程”的概念,也是“Dynabook”(笔记本电脑的雏形)的最早阐述者…

动态表单构建器——建造者模式
在编写一个弹出框时,它可以包含确定按钮,取消按钮,标题栏,关闭按钮,最小化按钮,内容,最大化按钮等内容,但这些内容在不同的需求下又不是必须存在的,不同的需求需要对这些组件自由组合…

网页素材大宝库:50套非常精美的图标素材
图标对网页设计师来说是宝贵的财富,高质量的图标素材既能为设计师节省时间,又能有很不错的效果。网上的免费图标素材非常多,可以说是琳琅满目,那些充满分享精神的设计师们把素材共享出来,让更多的人可以使用他们的优秀…
AI 面试“泛滥”的时代,HR该如何甄别真假“AI”?
作者 | 无缺编辑 | 王晓曼出品 | AI科技大本营(ID:rgznai100)在互联网、物联网蓬勃发展的中国,AI在商业化领域的运用,大家并不陌生。但AI在人力资源领域的发展前景如何?这是一个复杂且相对陌生的话题,也没有…

C语言里面%2d 意思
看看下面的说明就知道啦:修饰符 格式说明 意义 int a1;int b1234;double c1.2345678;printf("%2d\n",a);printf("%2d\n",a);printf("%4d\n",a);printf("%2d\n",b);printf("%2d\n",b);printf("%4d\n",b…

DatagridView自动充满屏幕,并能指定某列宽度
1、要使datagridview正好充满屏幕,设置其AutoSizeColumnsMode属性为fill 2、 同时,我们想要某列宽点,某列窄点,在AutoSizeColumnsMode属性为fill的前提下,设置FillWeight 属性 FillWeight :获取或设置一个值…

在网页中动态的生成一个gif图片
作者: love.net 大家知道股票网站的K线图是动态生成的定时刷新PHP 就有动态生成图片的功能 那么怎样用asp.net在网页中动态的生成一个图片呢? 下面我要举的例子是动态的生成一个图片显示当前时间 namespace Wmj { using System; using System.Drawing; u…
11项重大发布!百度大脑语言与知识技术峰会全程高能
AI正在向更深层次进化,语言与知识技术的重要性愈加凸显。8月25日,以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会重磅开启,百度CTO王海峰发表主旨演讲,解读百度语言与知识技术的发展历程与最新成果&#…