75道常见AI面试题,看看你的知识盲点在哪?(附解析)
整理 | AI科技大本营
出品 | AI科技大本营(公众号id:rgznai100)
【导语】正值求职、跳槽季,无论你是换工作还是找实习,没有真本事都是万万不行的,可是如何高效率复习呢?之前我们给大家推荐了一份 Python 面试宝典,收藏了近 300 道面试题,今天为为家精心准备了一份 AI相关岗位的面试题,帮大家扫清知识盲点,自信上场!
机器学习工程师面试
1、你会在时间序列数据集上使用什么交叉验证技术?是用k倍或LOOCV?
2、你是怎么理解偏差方差的平衡的?
3、给你一个有1000列和1百万行的训练数据集,这个数据集是基于分类问题的。经理要求你来降低该数据集的维度以减少模型计算时间,但你的机器内存有限。你会怎么做?
4、全球平均温度的上升导致世界各地的海盗数量减少。这是否意味着海盗的数量减少引起气候变化?
5、给你一个数据集,这个数据集有缺失值,且这些缺失值分布在离中值有1个标准偏差的范围内。百分之多少的数据不会受到影响?为什么?
6、你意识到你的模型受到低偏差和高方差问题的困扰。那么,应该使用哪种算法来解决问题呢?为什么?
7、协方差和相关性有什么区别?
8、真阳性率和召回有什么关系?写出方程式。
9、Gradient boosting算法(GBM)和随机森林都是基于树的算法,它们有什么区别?
10、你认为把分类变量当成连续型变量会更得到一个更好的预测模型吗?
11:“买了这个的客户,也买了......”亚马逊的建议是哪种算法的结果?
12、在k-means或kNN,我们是用欧氏距离来计算最近的邻居之间的距离。为什么不用曼哈顿距离?
13、我知道校正R2或者F值是用来评估线性回归模型的。那用什么来评估逻辑回归模型?
14、为什么朴素贝叶斯如此“朴素”?
15、花了几个小时后,现在你急于建一个高精度的模型。结果,你建了5 个GBM(Gradient Boosted Models),想着boosting算法会展现“魔力”。不幸的是,没有一个模型比基准模型表现得更好。最后,你决定将这些模型结合到一起。尽管众所周知,结合模型通常精度高,但你就很不幸运。你到底错在哪里?
以上题目答案详解:
https://www.tinymind.cn/articles/109
【推荐收藏】
机器学习教材中的 7 大经典问题
https://www.tinymind.cn/articles/83
算法工程师面试题
工作中的算法工程师,很多时候,会将生活中转瞬即逝的灵感,付诸产品化。
将算法研究应用到工作中,与纯粹的学术研究有着一点最大的不同,即需要从用户的角度思考问题。很多时候,你需要明确设计的产品特征、提升的数据指标,是不是能真正迎合用户的需求,这便要求算法工程师能在多个模型间选择出最合适的那个,然后通过快速迭代达到一个可以走向产品化的结果。知识储备作为成功的根底亦必不可少,以下是营长为你精选的算法面试,帮你检查下自己的技能是否在线。
1. LDA(线性判别分析) 和 PCA 的区别与联系
2. K-均值算法收敛性的证明
3. 如何确定 LDA (隐狄利克雷模型) 中主题的个数
4. 随机梯度下降法的一些改进算法
5. L1正则化产生稀疏性的原因
6. 如何对贝叶斯网络进行采样
7. 从方差、偏差角度解释 Boosting 和 Bagging
8. ResNet的提出背景和核心理论
9. LSTM是如何实现长短期记忆功能的
10. WGAN解决了原始 GAN 中的什么问题
以上题目答案详解:
https://www.tinymind.cn/articles/1275
【推荐收藏】
是男人就过8题!楼教主出题,请接招
https://www.tinymind.cn/articles/47
算法和编程面试题精选TOP50!(附代码+解题思路+答案)
https://www.tinymind.cn/articles/3759
深度学习12大常见面试题
1.什么是深度学习?为什么它会如此受欢迎?
3.深度学习与机器学习有什么区别?
4.深度学习的先决条件是什么?
5.选择哪些工具/语言构建深度学习模型?
6.为什么构建深度学习模型需要使用GPU?
7.何时(何处)应用神经网络?
8.是否需要大量数据来训练深度学习模型?
9.哪里可以找到一些基本的深度学习项目用来练习?
10.深度学习的一些免费学习资源
最后附上深度学习的相关面试问题有哪些?
(1)深度学习模型如何学习? (2)深度学习模型有哪些局限性? (3)前馈神经网络和递归神经网络之间有什么区别? (4)什么是激活特征函数? (5)什么是CNN,它有什么用途? (6)什么是池化? 简述其工作原理。 (7)什么是dropout层,为什么要用dropout层? (8)什么是消失梯度问题,如何克服? (9)什么是优化函数?说出几个常见的优化函数。
以上题目答案详解:
https://www.tinymind.cn/articles/608
Python常见面试题
100+Python编程题给你练~(附答案)
https://www.tinymind.cn/articles/3987
10个Python常见面试题,这些弄不明白不要说学过Python!
https://www.tinymind.cn/articles/3768
Google人工智能面试题
1、求导1/x。
2、画出log (x+10)曲线。
3、怎样设计一次客户满意度调查?
4、一枚硬币抛10次,得到8正2反。试析抛硬币是否公平?p值是多少?
5、接上题。10枚硬币,每一枚抛10次,结果会如何?为了抛硬币更公平,应该怎么改进?
6、解释一个非正态分布,以及如何应用。
7、为什么要用特征选择?如果两个预测因子高度相关,系数对逻辑回归有怎样的影响?系数的置信区间是多少?
8、K-mean与高斯混合模型:K-means算法和EM算法的差别在哪里?
9、使用高斯混合模型时,怎样判断它适用与否?(正态分布)
10、聚类时标签已知,怎样评估模型的表现?
11、为什么不用逻辑回归,而要用GBM?
12、每年应聘Google的人有多少?
13、你给一个Google APP做了些修改。怎样测试某项指标是否有增长
14、描述数据分析的流程。
15、高斯混合模型 (GMM) 中,推导方程。
16、怎样衡量用户对视频的喜爱程度?
17、模拟一个二元正态分布。
18、求一个分布的方差。
19、怎样建立中位数的Estimator?
20、如果回归模型中的两个系数估计,分别是统计显著的,把两个放在一起测试,会不会同样显著?
以上题目答案详解:
https://www.tinymind.cn/articles/98
苹果人工智能面试题
1、有成千上万个用户,每个用户都有 100 个交易,在 10000 个产品和小组中,用户所参与有意义的部分,你是如何处理这一问题的?
2、为了消除欺诈行为,我们对这些数据进行预筛选,如何才能找到一个数据样本,帮助我们判断一个欺诈行为的真实性?
3、给出两个表格,一个表格用来存储用户 ID 以及购买产品 ID(为1个字节),另一个表格则存储标有产品名称的产品 ID。我们尝试寻找被同一用户同时购买的这样一个成对的产品,像葡萄酒和开瓶器,薯片和啤酒。那么,如何去寻找前 100 个同时存在且成对出现的产品?
4、详细描述 L1 正则化和 L2 正则化二者之间的区别,特别是它们本身对模型训练过程的影响有什么不同?
5、假设你有 10 万个存储在不同服务器上的文件,你想对所有的文件进行加工,那么用 Hadoop 如何处理?
6、Python 和 Scala 之间有什么区别?
7、解释一下 LRU Cache 算法。
8、如何设计一个客户——服务器模型,客服端每分钟都可以发送位置数据。
9、如何将数据从一个 Hadoop 聚类传递给另一个 Hadoop 聚类?
10、Java 中的内存有哪些不同的类型?
11、你是如何处理数百个标题中的元数据这一繁琐任务的?
12、在数据流和可访问性方面,如何在隐藏时间帧内进行测量?其中在隐藏时间帧内,核心超负荷将计算机能量重定向到 cellar dome 的过度复杂文件系统的边界结构。
13、你最希望拥有的超能力是什么?
14、如果你有一个时间序列传感器,请预测其下一个读数。
15、使用 SQL 创建 market basket 输出。
16、你有没有过心理物理学实验的经验?(Research Portfolio based question)
17、你在表征方法上的专长是什么?通常使用什么?你是如何在研究中使用它,有没有什么有趣的结果?(Research Portfolio based question)
18、如何进行故障分析?
19、检查一个二叉树是否为左右子树上的镜像。
20、什么是随机森林?为什么朴素贝叶斯效果更好?
以上题目答案详解:
https://www.tinymind.cn/articles/139
大家可在详解页面查找以上所有问题的答案,面试除了运气,更多还是需要扎实的基本功。努力刷题吧,祝大家都能所向披靡,顺利进入心仪的公司~
(本文为 AI科技大本营整理文章,转载请微信联系 1092722531)
4 月13日-4 月14日,CSDN 将在北京主办“Python 开发者日( 2019 )”,汇聚十余位来自阿里巴巴、IBM、英伟达等国内外一线科技公司的Python技术专家,还有数百位来自各行业领域的Python开发者。目前购票通道已开启,早鸟票限量发售中,3 月15日之前可享受优惠价 299 元(售完即止)。
推荐阅读:
让数百万台手机训练同一个模型?Google把这套框架开源了
她们,在”图形“科研的征途里洒下坚定信仰
2018中国开发者真实现状:40岁不做开发,算法工程师最稀缺!
人生苦短,Python之父要解开这个困惑
从起源、变体到评价指标,一文解读NLP的注意力机制
女子偷师男子学校,变身区块链开发工程师,却说: “这次女人不会再缺席了!”
云漫圈 | 如何给女朋友解释什么是HTTP
从程序媛到全球研发副总裁,技术女神进击史!
杨超越杯编程大赛上热搜:不懂技术真不敢追星女子偷师男子学校,变身区块链开发工程师,却说: “这次女人不会再缺席了!”
❤点击“阅读原文”,查看历史精彩文章。
相关文章:
Flex画流程图
<?xml version"1.0" encoding"utf-8"?><mx:Application xmlns:mx"http://www.adobe.com/2006/mxml" layout"absolute" creationComplete"initApp()"> <mx:Canvas id"paper" x"30" y&q…
【Qt】Qt信号与槽使用不当,使程序崩溃
问题描述 跨线程使用Qt信号和槽,信号发送时间间隔小于槽函数处理时间时,造成程序崩溃。 原因分析 跨线程使用Qt信号和槽时,connect默认是QueuedConnection,队列连接方式。 信号传递给槽函数的参数,分配内存后放入队…
70亿美金!英伟达欲竞购这家以色列芯片公司!
整理 | 琥珀出品 | AI科技大本营(公众号id:rgznai100)近日,据国外财经媒体 Calcalist 报道,英伟达已给出报价,竞购以色列芯片设计公司迈络思(MellanoxTechnologies)。实际上…
Mysql安全配置
zhangsan 2014/06/14 11:550x01 前言很多文章中会说,数据库的权限按最小权限为原则,这句话本身没有错,但是却是一句空话。因为最小权限,这个东西太抽象,很多时候你并弄不清楚具体他需要哪些权限。 现在很多mysql用着r…
【C++】Google C++编码规范(一):作用域
1、文件作用域: 在.cpp文件中,C使用匿名名字空间来表示文件作用域,C使用static来表示; 2、局部变量 局部变量在声明的同时,进行显示初始化;比起隐式初始化再赋值要高效; 局部变量的作用域要尽…
华为 | 人生苦短,码短情长,有场大Party等你来Pick!
上学时,书上说C语言是上帝的语言。我同屋的兄弟不服,他说PHP才是最好的语言。毕业之后,我们Team的老大却坚信:Life is short,只用Python……现在,作为一个真正的开发者,我发现用什么语言一点点都…
设置进程优先级
//取得本进程id HANDLE hProcess GetCurrentProcess(); //设置本进程的优先级 int stat SetPriorityClass(hProcess, NORMAL_PRIORITY_CLASS);
Deep Reading | 从0到1再读注意力机制,此文必收藏!
译者 | forencegan编辑 | 琥珀出品 | AI科技大本营(ID: rgznai100)【AI科技大本营导语】注意力机制(Attention)已经成为深度学习必学内容之一,无论是计算机视觉还是自然语言处理都可以看到各种各样注意力机制的方法。之…
【C++】Google C++编码规范(二):类
1、构造函数 不要在构造函数中进行复杂的初始化 (尤其是那些有可能失败或者需要调用虚函数的初始化). 构造函数不得调用虚函数, 或尝试报告一个非致命错误. 如果对象需要进行有意义的 初始化, 考虑使用明确的 Init() 方法或使用工厂模式. 2、初始化 第一种方法:构…
Flask与Django对比
Flask与Django对比 Django vs FlaskFlask框架之间的差别 Django功能大而全,Flask只包含基本的配置 Django的一站式解决的思路,能让开发者不用在开发之前就在选择应用的基础设施上花费大量时间。Django有模板,表单,路由,…
windows下apache配置虚拟主机的两个方法
windows下apache配置虚拟主机方法一: 对httpd.conf进行设置:1.注释以下三行#ServerAdmin#ServerName#DocumentRoot2.去掉mod_proxy.so和mod_proxy_ajp.so的注释3.#Virtual hosts#Include conf/extra/httpd-vhosts.conf ࿰…
大疆、港科大联手!双目3D目标检测实验效果大放送 | CVPR 2019
作者 | heryms责编 | JaneCVPR 2019的文章出来了,今天聊聊双目的 3D object detection。这是一篇来自 DJI (大疆)与港科大合作的文章《Stereo R-CNN based 3D Object Detection for Autonomous Driving》,作者分别是 Peiliang Li&…
【C++】Google C++编码规范(三):智能指针
【C】Google C编码规范(一):作用域 【C】Google C编码规范(二):类 std::unique_ptr std::unique_ptr是C11标准里新推出的智能指针,用来表示动态分配出的对象的「独一无二」所有权;…
Django restful-framework初步学习
urls.py from django.conf.urls import include, url from django.contrib import admin from rest_framework import routers # 导入api路由 from app01 import apirouter routers.DefaultRouter() # 获取api路由对象 router.register(rusers, api.UserViewSet) # 注册路由到…
植树节,程序员要爬哪些“树”?
作者 | 程序猿小吴、进击的Hello_World转载自五分钟学算法(ID: CXYxiaowu)公历 3 月 12 日是一年一度的植树节。旨在宣传保护森林,并动员群众参加植树造林活动。说到树,程序猿们肯定不陌生,趁着这个植树节,…
把JS 脚本嵌入CS运行
下面这段视频,是让您知道怎样把播放器的javascript放入C#类别中。在调用这个类别时,只传入相关的参数,即可运行。一时类别封装了,在前台xxx.aspx或xxx.aspx.cs看不到播放器的代码。 另一个就是在CS内怎样运行Javascript脚本。此工…
【C++】Google C++编码规范(四):其他C++
引用参数 所有按引用传递的参数必须加上const; 这在Google Code上是一个硬性约定:输入参数是值参或const的引用参数,输出参数为指针,输入参数可以是const指针,但决不能是非const的引用参数,除非用于交换,比…
使用Ceph集群作为Kubernetes的动态分配持久化存储
2019独角兽企业重金招聘Python工程师标准>>> 使用Docker快速部署Ceph集群 , 然后使用这个Ceph集群作为Kubernetes的动态分配持久化存储。 Kubernetes集群要使用Ceph集群需要在每个Kubernetes节点上安装ceph-common 1. 为kubernetes创建一个存储池 1 2 #…
Cosmos的基石:IL2CPU编译器--.net/C#开源操作系统学习系列三
本文的代码包以cosmos-12304.zip为例(从这个包开始,COSMOS的内核算是有了个基本的雏形,就像是一颗大树在出芽前会先长出庞大的根系,现在就要破土长出第一颗芽了) IL2CPU之于COSMOS就相当与GCC之于LINUX,查看…
【面试 多线程】【第九篇】多线程的问题
1.多线程有什么用 发挥多核CPU优势,防止阻塞,更快的处理数据 2.多线程的实现方式有哪几种,分别的特点优势是什么样的 1》继承Thread类,重写run方法,start启动多线程 2》实现Runnable接口,重写run方法&…
那个大战AlphaGo的柯洁,将免试入读清华大学工商管理专业
日前,柯洁将免试入读清华大学的消息经媒体曝光了出来。《2019 年优秀运动员免试入学推荐名单》3 月 10 日开始公示,围棋世界冠军柯洁的名字出现在名单上,其中表明他将就读清华大学工商管理类专业。据了解,柯洁预计今年下半年入学清…
【Qt】设置背景
1、使用样式表qss设置背景 QDialog 设置背景图片: dlg->setStyleSheet("QDialog{border-image: url(://test.png);}"); 设置背景颜色: dlg->setStyleSheet("QDialog{background-color: red;}"); QWidget 设置背景图片: wgt->setStyleSheet…
基于Hadoop的MapReduce框架研究报告
http://www.doc88.com/p-19830708273.html
【Qt】设置窗口透明度
1、使用setWindowOpacity设置透明度 setWindowOpacity(0.5); 设置完成会使窗体、标题栏、子控件都透明 2、使用样式表qss设置窗体透明 dlg->setStyleSheet("QDialog{background-color: rgba(255, 0, 0, 0.5);}");wgt->setStyleSheet("QWidget{backgrou…
7行Python代码,搭建可以识花的机器学习App|视频教程
你想学Python,却不知如何着手,那你需要一种更加有趣的学习方式。Siraj Raval是一位人工智能领域的编程高手,毕业于哥伦比亚大学,曾任职于 Twilio 和 Meetup,他通过制作教程类短视频的方式在Youtube上积累了大量的粉丝&…
java中缀表达式转后缀表达式(逆波兰算法)
四则运算是栈的重要应用之一 中缀表达式转后缀表达式(逆波兰算法)过程 从左到右遍历中缀表达式数字直接输出为后缀表达式一部分如果是符号,则判断与栈顶元素的优先级高于栈顶元素优先级直接入栈低于或等于栈顶优先级栈顶元素出栈并输出为后缀…
Wpf消息循环之消息传递
几天遇见一个问题需要检查某个wpf程序是否已经运行,如果没有运行则启动传递参数,如果已运行则需要直接传递消息。在没有运行 情况下传递参数很简单,我们只需要Process cmd窗口启动并传递参数,在程序中处理。但是如果程序已经启动有…
【Qt】使用sqlite3数据库时,主键自增和获取自增后的主键的
创建数据表格,设置主键自增 创建数据库时,启用主键自增加特性 Create table testTable (id INTEGER PRIMARY KEY AUTOINCREMENT,。。。。 注意事项:设置主键自增时(AUTOINCREMENT),主键类型必须是INTEGER&…
拿下斯坦福和剑桥双offer,00后的算法学习之路
董文馨,00后,精通英语,西班牙语。斯坦福大学计算机系和剑桥大学双Offer,秋季将进入斯坦福大学学习。10岁开始在国外上学;12岁学Scratch;13岁学HTML & CSS;14岁开始学Python & Java&…
Mybatis【配置文件】就是这么简单
配置文件和映射文件还有挺多的属性我还没有讲的,现在就把它们一一补全 映射文件 在mapper.xml文件中配置很多的sql语句,执行每个sql语句时,封装为MappedStatement对象,mapper.xml以statement为单位管理sql语句 Statement的实际位置…