当前位置: 首页 > 编程日记 > 正文

想成为一个数据科学家却不知道从何下手?这份路线图带你打开数据科学大门!...

作者 | Jane

译者 | 火火酱 责编 | 徐威龙

出品 | AI科技大本营(ID:rgznai100)

你想成为一名数据科学家吗?你对数据科学了解很多,想知道关于数据科学天花乱坠的宣传都在讲什么吗?

那好,你算是来对了地方。在过去的十年中,数据科学领域有了稳定的发展。如今,有多种方法可以进入该领域并使你成为数据科学家。并非所有人都需要你拥有理想的学历。让我们开始探索吧!

什么是数据科学家?你想做什么?

如今,数据科学和数据科学家的定义因公司而异。以作者的经验,公司雇用的人和他们想要的人之间存在差异。数据科学是一个非常广阔的领域,成为数据科学家并不意味着你需要了解并有能力做其背后的一切。

作者对你的第一个建议是研究数据科学的各个方面,并找出最吸引你兴趣的地方。你还应该调查他们的职位和行业需求。根据这些因素做出选择, 做出决定后,你应该考虑获取有关数据科学特定方面的更多知识。

成为数据科学家需要学历吗?

这是一个很常见的问题,很难回答。作者推荐你接受高等教育,但这不是每个人都可行的选择。实际上,这甚至不是硬性的要求。当然,学历可能会给你带来一份第一份工作的好处(关键词是可能)。 但是,有许多人在没有任何专门的大学学历的情况下作为数据科学家和分析师取得了成功的职业生涯。你可能想研究可以帮助自己学习的在线课程。你应该检查他们对参加这些课程的人的评论和成功案例,甚至尝试与他们取得联系。

网络很重要。

一旦你决定了对数据科学的兴趣,甚至在你的心目中有理想的工作。你需要开始与人交流,发送邮件给你理想公司的工作人员,或者你想要加入该领域的专业人员,请他们提供一些建议。他们中的大多数人可能没有回应,但其中一些人会回应,这是非常有价值的建议。你是选择大学学历还是在线课程。你需要不断更新简历和社交资料。  LinkedIn是专业的社交网络,你可以使用它!

选择一种编程语言

Python和R语言是用于数据科学的最受欢迎的编程语言。一方面,R语言在过去的二十年中一直是统计和数据分析的领先语言。另一方面,Python在过去五年中已迅速成为最受欢迎和增长最快的编程语言之一。

数学是你的朋友

数据科学中每天使用统计信息、回归模型、图形模型、基本2D和3D几何形状、矩阵和分布模型等。复习基础知识,并尝试尽可能多地学习。如果没有良好的数学处理能力,你根本无法成为一名数据科学家。作者建议阅读与数据科学和你所选领域有关的文章,以了解你确切需要学习哪些知识。收听相关播客也可能会有帮助。也有许多免费的在线课程可以为你提供帮助。

做一些项目(最重要的部分)

没有什么可以像你自己设计的项目那样展示自己的技能和知识。不要等到你对所做项目足够了解为止。现在就开始使用你所知道的任何知识。这会展示你直到现在所学的知识,增进你对概念的理解,并为你提供继续前进的信心和动力。

继续做适合你当前水平的项目。这样,你可以通过基本概念和高级概念来展示自己的技能。项目还将展示你的进度。尽量避免使用他人的代码,因为它们是你的项目,这是有原因的。你可能已经从其他人那里获得了该项目的想法,但是项目本身应该反映你的方法和技能。

贡献开源项目

有许多开源项目正在不断寻找优秀的贡献者。你甚至可以找到适合初学者的项目,并随着自己的信心而提升自己的能力。

这不仅可以提高和展示你的技能,还有助于建立关系和联系。其他贡献者、甚至项目负责人和项目所有者,可能会帮助你获得第一份工作。

信心的飞跃

到现在为止,你应该拥有一些项目。你具有资格(大学学历或在线课程证书)。而且你还有一些联系方式可能会帮助你进入该行业。

回到开始时联系的人, 向他们展示你这段时间的进步,并告诉他们你对他们所给的建议表示感谢。将简历发送到尽可能多的地方可能会找到工作,但是面对面的面试总是最好的。


结论

努力工作和奉献总会有回报。聪明的工作报酬更高。这篇指南一定会引导你成功地成为数据科学家,并帮助你完成理想的工作。即使你找到工作并加入该行业,也不要停止学习,也不要停止为社区做贡献。这是作者送给所有数据科学爱好者的礼物。你永远不会知道,一个更好的机会可能就在拐角处等着你。

希望这篇文章对你有用,欢迎评论区和我们讨论。

原文:

https://hackernoon.com/a-roadmap-for-becoming-a-data-scientist-yg6l321r

【end】

原力计划

《原力计划【第二季】- 学习力挑战》正式开始!即日起至 3月21日,千万流量支持原创作者!更有专属【勋章】等你来挑战

推荐阅读

  • 2.2版本发布!TensorFlow推出开发者技能证书

  • 如何用 CNN 玩转 AlphaGo 版的五子棋?

  • 美团十年,支撑全球最大规模外卖配送的一站式机器学习平台是如何炼成的?

  • 2020 年最新版 68 道Redis面试题,20000 字干货,赶紧收藏起来备用!

  • 最近一个名为 BTCU 的比特币分叉,准备用新分叉解决比特币网络的旧问题

  • 返鄂复工人员自述:回武汉上班,要先飞合肥,再由公司包车接回去

  • 你点的每个“在看”,我都认真当成了AI

相关文章:

bzoj 1691: [Usaco2007 Dec]挑剔的美食家

Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 621 Solved: 280[Submit][Status][Discuss]Description 与很多奶牛一样,Farmer John那群养尊处优的奶牛们对食物越来越挑剔,随便拿堆草就能打发她们午饭的日子自然是一去不返了。现在,Farmer…

PHP内核中的哈希表结构

https://github.com/HonestQiao/tipi/commit/17ca680289e490763a6a402f79afa2a13802bb36 下载:https://github.com/HonestQiao/tipi/tree/master/book/sample/chapt03 原文地址:http://www.nowamagic.net/librarys/veda/detail/1344 PHP中使用最为频…

应聘苹果数据科学家,你需要知道些什么?

作者 | Jay Feng译者 | 孙薇,责编 | 屠敏头图 | CSDN 下载自东方 IC出品 | CSDN(ID:CSDNnews)以下为译文:苹果公司是全球最大的技术公司之一,从事电子消费产品、计算机软件以及在线服务的设计、开发并销售工…

python 利用模板文件生成配置文件

2019独角兽企业重金招聘Python工程师标准>>> gen.py: __author__ fuhan from jinja2 import Template a{name:a} b{name:b} mode_dict { a:a, b:b } def gen_config(tplt_file, modea): with open(tplt_file, r) as r: tplt Template(r.read()) config mode_dic…

利用Apache的ab命令做Benchmark性能测试

测试系统性能,例如httpsqs # ab -k -c 10 -n 100000 "http://127.0.0.1:1218/?namexoyo&optput&dataabc ab是Apache超文本传输协议(HTTP)的性能测试工具。 其设计意图是描绘当前所安装的Apache的执行性能,主要是显示你安装的Apache每秒可…

MySQL 狠甩 Oracle 稳居 Top1,私有云最受重用,大数据人才匮乏! | 中国大数据应用年度报告...

整理 | 屠敏出品 | CSDN(ID:CSDNnews)科技长河,顺之者昌,错失者亡。在这个技术百态之中,中国专业的 IT 社区CSDN 创始人&董事长蒋涛曾多次在公开活动中表示,开发者是对技术变革最敏感的人群。这不仅源于…

MAC安装OpenXenManager管理Xenserver

官方文档:https://github.com/OpenXenManager/openxenmanager要求:Python 2.7pyGTK 2.16ConfigObjRavenGTK-VNC(仅限Linux)Debian / Ubuntu Linux软件包依赖项:python2.7 python-gtk2 glade python-gtk-vnc python-gla…

用Flutter + Dart快速构建一款绝美移动App

作者 | Wojciech Kuroczycki译者 | 弯月来源 | CSDN(ID:CSDNnews)如今,与前端或移动相关的新框架层出不穷。所有从事Web开发的人都应该熟悉各种目不暇接的新方法以及针对复杂问题的轻量级解决方案。我们不再因为没有现成的技术而烦恼&#xf…

自己写的单链表

link.c #include <stdio.h> #include <malloc.h> #include <string.h> #include <stdlib.h> #include "link.h"/**** 这是一个计算HASH值的算法**/ int time33(char* arKey,int arlength){int h 0;int i;for(i0;i<arlength;i){h h*3…

假装不知道有尽头(博弈论的诡计)

《笑林广记》中记载这样一则笑话。 有一个人去理发铺剃头&#xff0c;剃头匠给他剃得很草率。剃完后&#xff0c;这人却付给剃头匠双倍的钱&#xff0c;什么也没说就走了。一个多月后的一天&#xff0c;这人又来理发铺剃头。剃头匠还记得他上次多付了钱&#xff0c;觉得此人阔绰…

Java Script 第四节课 Java Script的隐式转换

<!DOCTYPE html><html><head><meta charset"utf-8"><title></title><script type"text/javascript">/*if(exp){exp为true的代码段;}else{exp为false的代码段;}*///其它类型转换成布尔类型假的有var a;//undefin…

深入理解malloc和free

1.为什么free是void*&#xff0c;那么它怎么知道要释放多少内存&#xff1f; 《UNIX环境高级编程》 《C语言编程常见问题解答》 《你必须知道的495个C语言问题》 《UNIX环境高级编程》 2.free源码 内存控制块结构定义 struct mem_control_block {int is_available;int si…

根据IP和MAC查端口

进入交换机的命令提示符.输入show ip arp 查出IP地址跟MAC 地址的对照表.再输入show mac-address-table,看一下这个MAC是从哪个端口学到的转载于:https://blog.51cto.com/124130/271033

“数学不好,干啥都不行!”骨灰级程序员:其实你们都是瞎努力!

之前很多程序员读者向我们反馈&#xff1a;1&#xff09;数据结构、编程语句&#xff0c;核心原理都是数学&#xff0c;不会数学搞编程好难&#xff0c;后来发现各种东西还要概率论&#xff0c;还要推收敛&#xff01;近似还要知道泰勒展开&#xff01;2&#xff09;做算法优化…

转:秒杀系统架构分析与实战

原文出处&#xff1a; 陶邦仁 欢迎分享原创到伯乐头条 0 系列目录 秒杀系统架构 秒杀系统架构分析与实战1 秒杀业务分析 正常电子商务流程 &#xff08;1&#xff09;查询商品&#xff1b;&#xff08;2&#xff09;创建订单&#xff1b;&#xff08;3&#xff09;扣减库存&a…

Visual Studio中的《C# 语言规范》

无意中的无意发现了个好东西——《C# 语言规范》&#xff0c;您不用到处下载&#xff0c;它就在您的Visual Studio安装目录中&#xff0c;例如&#xff1a;F:\Program Files\Microsoft Visual Studio 9.0\VC#\Specifications\2052\CSharp Language Specification.doc 这是它的目…

超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M

整理 | AI科技大本营光学字符识别&#xff08;OCR&#xff09;技术已经得到了广泛应用。比如发票上用来识别关键字样&#xff0c;搜题App用来识别书本上的试题。近期&#xff0c;这个叫做chineseocr_lite的OCR项目开源了&#xff0c;这是一个超轻量级中文ocr&#xff0c;支持竖…

Redis队列的应用

Redis用双链表list实现队列的 LPUSH key value [value ...] 将一个或多个值 value 插入到列表 key 的表头 如果有多个 value 值&#xff0c;那么各个 value 值按从左到右的顺序依次插入到表头&#xff1a; 比如说&#xff0c;对空列表 mylist 执行命令 LPUSH mylist a b c &…

Python fabric实现远程操作和部署

fabrictitle是开发&#xff0c;但是同时要干开发测试还有运维的活 (o(╯□╰)o)近期接手越来越多的东西&#xff0c;发布和运维的工作相当机械&#xff0c;加上频率还蛮高&#xff0c;导致时间浪费还是优点多。修复bug什么的&#xff0c;测试&#xff0c;提交版本库(2分钟)&…

自己写的哈希表以及解决哈希冲突

哈希表就是键值key-value对&#xff0c;使用hash函数让key产生哈希值&#xff0c;当不同的key产生相同的哈希值时就是哈希冲突了&#xff0c;产生哈希冲突可以使用拉链法。 hash.c #include <stdio.h> #include <stdlib.h> #include <string.h> #include &…

Python与MySQL数据库的交互实战

作者 | Huang supreme编辑 | 郭芮图源 | 视觉中国安装PyMySQL库如果你想要使用python操作MySQL数据库&#xff0c;就必须先要安装pymysql库&#xff0c;这个库的安装很简单&#xff0c;直接使用pip install pymysql&#xff1b;假如这种方式还是安装不上&#xff0c;就用如下链…

Hyper-V的三种网卡

External 虚拟机和物理网络、本地主机都能通信 Internal 虚拟机之间互相通信&#xff0c;并且虚拟机能和本机通信 Private 仅允许运行在这台物理机上的虚拟机之间互相通信

filter-mapping中的dispatcher使用

web.xml里<filter-mapping>中的<dispatcher>作用 2.4版本的servlet规范在部属描述符中新增加了一个<dispatcher>元素&#xff0c;这个元素有四个可能的值&#xff1a;即 REQUEST,FORWARD,INCLUDE和ERROR 可以在一个<filter-mapping>元素中加入任意数目…

脉冲神经网络在目标检测的首次尝试,性能堪比CNN | AAAI 2020

译者 | VincentLee来源 | 晓飞的算法工程笔记脉冲神经网络(Spiking neural network, SNN)将脉冲神经元作为计算单元&#xff0c;能够模仿人类大脑的信息编码和处理过程。不同于CNN使用具体的值(continuous)进行信息传递&#xff0c;SNN通过脉冲序列(discrete)中每个脉冲发射时…

TCMalloc:线程缓存的Malloc

转载自&#xff1a; http://shiningray.cn/tcmalloc-thread-caching-malloc.html作者&#xff1a;Sanjay Ghemawat, Paul Menage 原文 翻译&#xff1a;ShiningRay 动机 TCMalloc要比glibc 2.3的malloc&#xff08;可以从一个叫作ptmalloc2的独立库获得&#xff09;和其他我测试…

今年央视的春晚能给人带来惊喜吗?

已经好多年还没看完中央电视台的春节联欢晚会自己就睡着了&#xff0c;说实在的&#xff0c;现在央视春节联欢晚会的节目总是让人期待后感到相当的平淡乏味&#xff0c;有些搞笑节目庸俗的让人笑不出来&#xff0c;绝大多数的节目都显得非常的人工&#xff0c;全然不能激发出观…

将baidu地图中的baidu logo去掉

Web 最简单方法&#xff0c;将logo的css样式改为display:none即可 <!DOCTYPE html> <html> <head><meta charset"utf-8" /><title>移除百度地图LOGO和版权信息</title><script type"text/javascript" src"htt…

Linux环境网络库

安装libevent 官网&#xff1a;http://libevent.org/ 书籍&#xff1a;http://www.wangafu.net/~nickm/libevent-book/ Libevent参考手册翻译:http://blog.csdn.net/laoyi19861011/article/category/831215 Libevent参考手册翻译增加&#xff1a;http://blog.sina.co…

万人马拉松赛事,人脸识别系统如何快速、准确完成校验?

作者 | 阿里文娱技术专家墨贤出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;大麦的人脸闸机在2019年杭州马拉松上成功的完成了刷脸入场功能的首秀&#xff0c;相比传统的马拉松入场核验方案在入场体验和入场效率上都有了很大的提升&#xff0c;下面介绍一下大麦的人…