当前位置: 首页 > 编程日记 > 正文

数据分析奥斯卡女神们,谁是你心中的No.1?

640?wx_fmt=jpeg


作者 | 徐麟

转载自数据森麟(公众号 ID:shujusenlin)


前言


在开始今天的正文前,首先带来一首经典的由奥黛丽·赫本演唱的《Moon River》,也是电影《蒂凡尼的早餐》中的主题曲。



640?wx_fmt=jpeg


一年一度的奥斯卡奖于上月落下了帷幕,截止到今年,奥斯卡已经走过了91年的历程。奥斯卡奖在为我们带来一次又一次的视觉盛宴同时,也为我们提供了更进一步了解活跃在影坛的女神们的机会。


女神节将至,我们首先主要祝愿广大的女性同胞美丽永驻。同时我们来为大家盘点一下那些在奥斯卡闪耀过的女神们,她们“惊艳了时光,温柔了岁月”,带给喜爱她们的人们一段段美好的回忆。


数据来源

要先感谢小F(Python大本营作者)之前的一篇文章 奥斯卡,究竟谁一直在陪跑 的启发,让我们找到了能够全面地获取女神们奥斯卡相关数据网站 - 时光网,首先我们获取的是时光网上历届奥斯卡最佳女主角的入围及获奖信息,我们从中确定了此次数说的女神们:


640?wx_fmt=png

  

获得了历届获奖以及提名名单后,我们就要进入女神们的主页:


640?wx_fmt=jpeg


女神们的主页信息还是很丰富的,主要是两个部分(a)上图左下角女神们的身高,星座以及出生年份 (b)上图中间网友对女神的喜爱度评分。有了这两部分的信息,我们就可以开始在后面的部分对女神们进行一系列的分析了。


部分的爬取代码如下:



driver = webdriver.Chrome()
driver.maximize_window() 
driver.close() 
driver.switch_to_window(driver.window_handles[0]) 

for i in range(queens_name.shape[0]):
    url = queens_name['profile'][i]
    js='window.open("'+url+'")'
    driver.execute_script(js)
    driver.close() 
    driver.switch_to_window(driver.window_handles[0])
    try:
        queens_name['photo'][i] = driver.find_element_by_xpath('//*[@id="personDetailRegion"]/div[1]/span/a').get_attribute('href')
        queens_name['height_star'][i] = driver.find_element_by_xpath('//*[@id="personDetailRegion"]/dl[1]').text
        queens_name['born_home'][i] = driver.find_element_by_xpath('//*[@id="personDetailRegion"]/dl[2]').text
        queens_name['count_score'][i] = driver.find_element_by_xpath('//*[@id="personRating"]/div[2]').text
    except:
    err_list=err_list+[i]


数说女神 -- 欢迎度

在开始数说女神与奥斯卡直接的故事前,我们先来看一下女神在大家心中的受欢迎程度,主要看的就是时光网上女神的喜爱度和投票人数两项指标:


640?wx_fmt=png


奥黛丽·赫本在榜单中的位置体现了她在观众心中无可替代的地位,赫本年轻时用出众的容貌和演技一次次在电影中惊艳这个世界,随着岁月的流逝,她选择了优雅地老去,致力于慈善事业,用一颗善良的心带给这个世界一份温柔。


费雯·在榜单中仅次于赫本,塑造的郝思嘉这一经典形象也是影响了一代又一代的观众。同时在榜单中我们也看到了娜塔莉·波特曼和凯特·温斯莱特这些年轻观众更为熟知的女神身影。

数说女神 -- 关注度

下面我们要看的就是女神们的受关注度,主要看的是有多少人在网站中为女神们进行评价:


640?wx_fmt=png


这份榜单,相对于之前的受欢迎度,可能出场的女神更为被年轻观众所熟知。同时在两份榜单中出现的只有奥黛丽·赫本和凯特·温斯莱特,她们也分别代表着经典和现代。


值得一提的是,榜单中排名前四的女神们,目前只有娜塔莉·波特曼染指过最佳女主角的奖项。其它三位高人气女神海瑟薇、朱莉和奈特莉,我们希望她们能够在未来拍出更多经典的作品,捧起奥斯卡最佳女主角的小金人奖杯。


数说女神 -- 提名&获奖

看完了女神的受欢迎度和关注度,我们来看一个大家都会比较关注的问题,那就是究竟哪位女神最受奥斯卡奖的青睐,获得最多次的奥斯卡最佳女主角奖:


640?wx_fmt=png


可以看到凯瑟琳·赫本以四次获奖的成绩在这个榜单中独占鳌头,说起赫本,可能奥黛丽·赫本的名字要更加熟悉一些,但实际上,在奥斯卡奖的认可度方面,凯瑟琳·赫本要更胜一筹。同时也看到了有13位女神两次获得奥斯卡奖最佳女主角,其中就有大名鼎鼎的费雯·丽、希拉里·斯万克以及 “奥斯卡常青树“ 梅丽尔·斯特里普


只要是和奖项相关的,就总是会“几家欢喜几家愁”,下面我们就来看一下各位女神入围最佳女主角奖的次数:


640?wx_fmt=png


梅丽尔斯·特里普以17次入围的表现毫无争议地在这项对比中遥遥领先,更加值得注意的是,这项数据可能在未来被继续刷新,我们也拭目以待。通过这份数据,我们也可以感受到奖项竞争的激烈情况,奥黛丽·赫本和葛利亚·嘉逊这种世界巨星也仅仅分在在5次和7次入围中有1次的获奖记录


同时我们也看到黛博拉·寇儿和艾琳·邓恩分别入围6次和5次最佳女主角,最终都与奖项无缘,我们一方面可能会感觉评委会有些不近人情,另一方面也更加体现出了奖项的含金量。


数说女神 -- 年龄

有人说“年龄是女人的秘密”,但是对于女神们来说,年龄只是一个符号。真正的女神会在不同的年龄去散发不同的光芒,每一束光芒都足以照亮这个世界。首先看一下那些入围时较为年长的女神:


640?wx_fmt=png


可以看到在这些女神面前,年龄真的只是一个标记,无碍她们散发自己的光芒。朱迪·丹奇更是在自己 72、73、80 岁的时候三次入围最佳女主角的提名。在10次最年长的提名中,杰西卡·坦迪和凯瑟琳·赫本分别在自己 81、75岁的时候最终摘得桂冠。


我们同时也来看一下,那些年少成名,入围时最为年轻的女神们:


640?wx_fmt=png


有两位都是在自己15岁前就入围最佳女主角的提名,想想大家的 15 岁,真的是要惊叹于她们把握机遇的能力。在10次最年轻的入围提名中,只有玛丽·玛特琳在1987年最终赢得桂冠,也成为了迄今为止最年轻的影后


我们看一下各个年份入围者的平均年龄


640?wx_fmt=png


大家可以会从中看到一些有趣的事情,我们就加上一条线性拟合的趋势线来让大家更清晰地去解读这些数据:


640?wx_fmt=png


这条趋势线是可以通过我们的线性检验,也说明了奥斯卡愈发的看重演员的资历,年龄真的越来越成为了一种符号,真正的女神就是可以在不同的年龄都展现属于自己的光芒。


数说女神 -- 身高

”年龄不是问题,身高也不是差距“。下面我们就来说说身高,有些人会比较武断地对女神的标准身高下一些定义,然而通过我们的数据分析,会发现女神们的身高实际上是很多元化的。利用好自己身材上的优势,展现出属于自己的魅力,才是最为重要的。


首先看一下身材高挑的女神们:


640?wx_fmt=png


女神中不乏有许多超过180cm的模特身材,身高其实真的并不能代表所有。榜单中排名前茅的妮可·基德曼身高180cm,然而其前夫汤姆·克鲁斯身高仅仅是173cm,虽然现在已是劳燕分飞,但也不失为一段佳话。


特别值得一提的是榜单中的裴淳华是《消失的爱人》女主角罗莎曼德·派克为自己起的中文名,未来也希望越来越多的女神们为自己起上一个好听的中文名。下面我们来看一下那些身材娇小的女神们:


640?wx_fmt=png


榜单中出现了许多熟悉的身影,比如伊丽莎白·泰勒、朱迪·福斯特 ,她们的身高都没有超过160cm,但并不妨碍她们成为大家记忆中永恒的女神。


下面我们仿照之前的入围年龄分析,看一下历年入围的影后平均身高


640?wx_fmt=png


可以看到整体趋势与入围的年龄整体上涨趋势有所不同,所呈现的趋势更像是一个抛物线,我们不妨进行一下二次项拟合:


640?wx_fmt=png


这条曲线也通过了参数的显著性检验,我们可以看到在1980、90年代的入围名单中,身高趋势线达到了一个峰值,之后有所下降。我们结合着不同时期出生的女神身高情况来进行对比:


640?wx_fmt=png


1950-1970之间出生的女神身高确实相对比较高,这样可以解释了上面入围者身高趋势的变化情况。我们也希望通过这部分的分析让大家能够尽量不要那么去看重一个人的身高,女神们的成功也证明了成功与否与身高无关


数说女神 -- 遗珠

纵使我们将奥斯卡最佳女主角所有的提名者放在一起,也会发现有很多留给我们经典回忆的女神们,并没有出现在榜单。下面我们就选取了部分未被提名过的女神们,为大家列出:


640?wx_fmt=png


名单中有许多我们耳熟能详的女神名字,比如苏菲·玛索、玛丽莲·梦露以及在《肖申克的救赎》中海报中出现的丽塔·海华丝。希望未来奥斯卡能够让更多的女神们得以入围。


部分分析代码如下:


k <- lm(age~year,data = reward)
reward$smooth_age <- predict(k,year = reward$year)
ggplot(reward,aes(x=year))+geom_line(aes(y=age),size=1.5)+
    theme_bw()+
    ggtitle('各年度入围者平均年龄')+
    theme(axis.text.x = element_text(size=18),
    axis.text.y = element_text(size=18),
    plot.title = element_text(hjust=0.5,size=35,face='bold'),
    panel.grid = element_blank(),
    legend.position = 'none',
    axis.title = element_text(size=25)
    )+geom_line(aes(y=smooth_age),col='darkblue',size=1.5)


结语

盘点完这些“惊艳了时光,温柔的岁月”的女神们,我们不妨静下心来,花上一点时间,找个安静的地方,选上一部电影佳作。静静地品味女神们为我们塑造过的经典角色。


本文的完整代码:

https://github.com/shujusenlin/oscar


欢迎大家留言与我们一起聊聊你心中的女神~


(本文为 AI科技大本营转载文章,转载请联系原作者)


征稿


640?wx_fmt=png

推荐阅读:

  • 300道Python面试题,备战春招!

  • 2018中国开发者真实现状:40岁不做开发,算法工程师最稀缺!

  • Python之父龟叔推荐的学习视频,有趣、好玩,全是好评!

  • 数据分析奥斯卡女神们,谁是你心中的No.1?

  • 5年Go语言经验薪资翻倍! 这份全球职业报告中, 区块链开发者薪资排第三, 前两名你绝对想不到!(含完整版下载资源)

  • 女神节 | 那些奋斗在IT领域的“女神”们

  • 聊天宝解散,多闪、马桶MT还会远吗?| 畅言

  • 程序员撒狗粮!3 天开发自己的婚礼小程序!

  • 为啥程序员下班后只关显示器从不关电脑?

640?wx_fmt=png

❤点击“阅读原文”,查看历史精彩文章。

相关文章:

ansible组件-playbook学习笔记

playbook的基础组件 name 定义playbook或者task的名称 hosts 用于指定要执行指定任务的主机 user 用于指定远程主机上的执行任务的用户 task 任务列表 vars 定义变量 vars_files 定义变量文件 notify 任务执行结果如果是发生更改的则触发定义在handler的任务 handlers 用于当前…

【linux工具】ldconfig:linux配置动态链接库

简介 ldconfig命令的用途主要是在默认搜寻目录/lib和/usr/lib以及动态库配置文件/etc/ld.so.conf内所列的目录下&#xff0c;搜索出可共享的动态链接库&#xff08;格式如lib*.so*&#xff09;,进而创建出动态装入程序(ld.so)所需的连接和缓存文件。 用法 ldconfig [-v|–ve…

T-SQL IN 谓词

T-SQL谓词之一 IN。检查指定(IN谓词前)的值&#xff0c;字段值或标量表达式是否包含在定义的一组元素(放在括弧内)中。这组元素可以有一或多个值&#xff0c;而不同值之间由逗点分开。 创建一个临时表&#xff0c;并插入一些值。 CREATETable#t( Fonts NVARCHAR(10))INSERTI…

vue:虚拟dom的实现

Vitual DOM是一种虚拟dom技术&#xff0c;本质上是基于javascript实现的&#xff0c;相对于dom对象&#xff0c;javascript对象更简单&#xff0c;处理速度更快&#xff0c;dom树的结构&#xff0c;属性信息都可以很容易的用javascript对象来表示&#xff1a; let element{tagN…

【Ubuntu】apt-get命令小结

apt-get install 安装软件包 apt-get remove 删除已安装的软件包&#xff08;保留配置文件&#xff09; apt-get update 更新 apt-get autoremove 自动删除没用的包 apt-get purge 删除包&#xff0c;不保留配置文件 apt-get –purge remove

腾讯58篇论文入选CVPR 2019,两年增长超200%

全球计算机视觉顶级会议 IEEE CVPR 2019(Computer Vision and Pattern Recognition&#xff0c;即IEEE国际计算机视觉与模式识别会议) 即将于6月在美国长滩召开。本届大会总共录取来自全球论文1299篇。中国团队表现不俗&#xff0c;此次&#xff0c;腾讯公司有超过58篇论文被本…

SQL Server 2008备份策略设计下(六)

上一篇博文探讨了各种恢复模式和备份类型&#xff0c;这一节继续来探讨如何设计备份策略。设计一个数据库的最佳备份策略&#xff0c;会面临如何选择使用哪种恢复模式的问题&#xff0c;因为恢复模式控制着备份和还原的行为。一般来讲&#xff0c;简单恢复模式一般适合用于测试…

【Qt】Qt样式表(Style Sheet):官网说明及例子

网址 http://doc.qt.io/qt-5/stylesheet.html 样式表语法 各种Qt控件的样式表例子 Qt样式表参考手册

神爱程序员,于是带来Python

“我累了&#xff0c;需要很长时间的休息。”2018 年 7 月&#xff0c;在 PEP 572&#xff08;Python 改进提案&#xff09; 被接受后的第三天&#xff0c;由于仍然不断面对着别人的质疑&#xff0c;反馈意见不断袭来&#xff0c;让这位一手缔造新的编程语言帝国的图灵奖获得者…

Dubbo配置文件详解

为新项目练手&#xff0c;把项目中用到的web service、RMI的服务改用DubboZookeeperSpring&#xff0c;网上找到几篇不错的配置详解 1.此篇博文主要从以下几种配置方式来讲 XML 配置文件方式、XML 配置文件方式、annotation 配置方式 https://www.cnblogs.com/chanshuyi/p/514…

Mono源代码学习笔记:Console类(四)

NullStream 类 (internal class) 下面就是 mcs/class/corlib/System.IO/NullStream.cs&#xff1a; 01: namespace System.IO 02: { 03: class NullStream : Stream 04: { 05: public override bool CanRead { get { return true; } } 06: public override b…

Java帝国对Python的渗透能成功吗?

作者 | 刘欣转载自码农翻身&#xff08;公众号 ID&#xff1a;coderising&#xff09;引子Java 帝国已经成立 20 多年&#xff0c;经过历代国王的励精图治&#xff0c;可以说是地大物博&#xff0c;码农众多。 可是国王依然不满足&#xff0c;整天想着如何继续开拓疆土&#xf…

【杂】突然有个想法,为了防止公司或其他,监视你的qq或微信,可以做个程序,将信息打乱,分别用qq和微信传输,然后,再还原

突然有个想法&#xff0c;为了防止公司或其他&#xff0c;监视你的qq或微信&#xff0c;可以做个程序&#xff0c;将信息打乱&#xff0c;分别用qq和微信传输&#xff0c;然后&#xff0c;再还原。

CTO 基本功大盘点 —— 没有这些技能,谈何远大前程?

本文由 「TGO鲲鹏会」原创&#xff0c;原文链接&#xff1a;CTO 基本功大盘点 —— 没有这些技能&#xff0c;谈何远大前程&#xff1f; 作者&#xff5c;刘海星 2018 年马上就要过去六分之一了&#xff0c;你的 KPI 完成多少了&#xff1f; 别沮丧&#xff0c;其实我想说的是&…

Windows Phone 7 不温不火学习之《创建用户控件》

同样出自微软的产品&#xff0c;像ASP.NET 一样&#xff0c;Windows Phone 7 也有一个叫UserControl 的东西。这个相当于一个组件&#xff0c;类似于Android 继承View 。 本篇将实现一个用户控件&#xff0c;默认为它添加高宽&#xff0c;并为它添加一个自己的事件&#xff0c;…

从起源、变体到评价指标,一文解读NLP的注意力机制

作者 | yuquanle转载自AI小白入门&#xff08;ID:StudyForAI&#xff09;目录1.写在前面2.Seq2Seq 模型3.NLP中注意力机制起源4.NLP中的注意力机制 5.Hierarchical Attention6.Self-Attention7.Memory-based Attention 8.Soft/Hard Attention9.Global/Local Attention10.评价指…

【Git】ubuntu上git commit提交后如何保存和退出类似vim的界面,回到命令行

问题 使用 git commit 命令后&#xff0c;进入类似vim的界面&#xff0c;开始时&#xff0c;不知道如何保存&#xff0c;甚至不知道怎么退出该界面。 解决方法 1、使用 git commit 命令后&#xff0c;进入的是nano文本编辑器&#xff08;类似vim&#xff09;&#xff1b; 2…

linux硬盘满了问题排查

关键指令&#xff1a; df du find step1&#xff1a; 如果发现硬盘满了&#xff0c;首先要确定一下&#xff0c;使用df查看硬盘使用情况 df -h step2&#xff1a; 从第一步结果判定满了&#xff0c;确定哪些文件或哪个文件占了大头&#xff0c;使用du指令做逐步排查&#xff0c…

win2003登陸及關機設定

開啟未登陸可以關機鍵關機﹕ 到控制面板&#xff0c;本地安全策略&#xff0c;安全性選項﹐启用允许在未登录前关机 關關機事件跟踪﹕ 运行“gpedit.msc”命令打开组策略编辑器&#xff0c;依次展开“计算机配置”→“管理模板”→“系统”&#xff0c;将“顯示关闭事件跟踪程序…

【Qt】信号和槽对值传递参数和引用传递参数的总结

在同一个线程中 当信号和槽都在同一个线程中时&#xff0c;值传递参数和引用传递参数有区别&#xff1a; 值传递会复制对象&#xff1b;&#xff08;测试时&#xff0c;打印传递前后的地址不同&#xff09; 引用传递不会复制对象&#xff1b;&#xff08;测试时&#xff0c;…

Node.js入门(含NVM、NPM、NVM的安装)

本文最初发表于博客园&#xff0c;并在GitHub上持续更新前端的系列文章。欢迎在GitHub上关注我&#xff0c;一起入门和进阶前端。 以下是正文。 Node.js的介绍 引擎 引擎的特性&#xff1a; JS的内核即引擎。因为引擎有以下特性&#xff1a; &#xff08;1&#xff09;转化的作…

GitHub日收7000星,Windows计算器项目开源即爆红!

说起此番微软开源 Windows 计算器&#xff0c;有道是“春风得意马蹄疾&#xff0c;一日‘摘星’ 7000”……整理 | 仲培艺来源 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;微软又来给自己拥抱开源的决心送”证明素材“了&#xff01;昨日&#xff0c;微软官宣在 MIT…

域环境下的***

首先还是先简要看一下域的概念吧&#xff1a; 域 (Domain) 是Windows网络中独立运行的单位&#xff0c;域之间相互访问则需要建立信任关系(即Trust Relation)。信任关系是连接在域与域之间的桥梁。当一个域与其他域建立了信任关系后&#xff0c;2个域之间不但可以按需要相互进行…

如何重构“箭头型”代码

本文主要起因是&#xff0c;一次在微博上和朋友关于嵌套好几层的if-else语句的代码重构的讨论&#xff08;微博原文&#xff09;&#xff0c;在微博上大家有各式各样的问题和想法。按道理来说这些都是编程的基本功&#xff0c;似乎不太值得写一篇文章&#xff0c;不过我觉得很多…

让数百万台手机训练同一个模型?Google把这套框架开源了

作者 | 琥珀出品 | AI科技大本营&#xff08;公众号id&#xff1a;rgznai100&#xff09;【导语】据了解&#xff0c;全球有 30 亿台智能手机和 70 亿台边缘设备。每天&#xff0c;这些电话与设备之间的交互不断产生新的数据。传统的数据分析和机器学习模式&#xff0c;都需要在…

【OpenCV】cv::VideoCapture 多线程测试

cv::VideoCapture多线程测试结果&#xff1a; 在多线程中使用抓取摄像头视频帧时线程安全的&#xff0c;但是&#xff0c;多个线程会共用摄像头的总帧率。 比如&#xff0c;我用两个线程测试30帧的摄像头&#xff0c;每个线程差多都是15帧。

都有Python了,还要什么编译器!

编译的目的是将源码转化为机器可识别的可执行程序&#xff0c;在早期&#xff0c;每次编译都需要重新构建所有东西&#xff0c;后来人们意识到可以让编译器自动完成一些工作&#xff0c;从而提升编译效率。但“编译器不过是用于代码生成的软机器&#xff0c;你可以使用你想要的…

【Qt】Qt发布程序时,报错: could not find or load the Qt platform plugin xcb

问题描述 Qt程序在发布时&#xff0c;报错&#xff1a; This application failed to start because it could not find or load the Qt platform plugin “xcb” in “”. Reinstalling the application may fix this problem Aborted (core dumped) 原因 没有将libqxcb…

jsky使用小记

jsky是一款深度WEB应用安全评估工具&#xff0c;能轻松应对各种复杂的WEB应用&#xff0c;全面深入发现里面存在的安全弱点。 jsky可以检测出包括SQL注入、跨站脚本、目录泄露、网页木马等在内的所有的WEB应用层漏洞&#xff0c;渗透测试功能让您熟知漏洞危害。 打开——新建扫…

BSP场景管理方法简介

BSP&#xff08;Binary Space Partition,二叉空间分割&#xff09;方法&#xff0c;在大型3d游戏场景管理方面&#xff0c;可以认为是已经证明了的&#xff0c;最成熟的&#xff0c;最经得起考验的场景管理方法。诸如虚幻系列引擎&#xff08;Unreal 1,2,3&#xff09;&#xf…