人工智能面试总结:160个机器学习面试题,赶紧先考考自己!
数据科学职位的典型面试过程会有很多轮,其中通常会涉及理论概念,目的是确定应聘者是否了解机器学习的基础知识。在这篇文章中,我想总结一下我所有的面试经历(面试or被面试)并提出了160多个数据科学理论问题的清单。其中包括以下主题:
线性回归 模型验证 分类和逻辑回归 正则化 决策树 随机森林 GBDT 神经网络 文本分类 聚类
排序:搜索和推荐 时间序列
? ? ? ? ? ? ? ? ? ? ? ?
这篇文章中的问题数量似乎远远不够,请记住,面试流程是根据公司的需求和你的工作经历而定的。因此,如果你的工作中没有用过时间序列模型或计算机视觉模型,就不会收到类似的问题。
提示:如果不知道某些面试问题的答案,不要灰心。为了简化起见,我根据难度将问题分为三类:
容易 中号 专家
? ? ?
有监督的机器学习
什么是有监督学习?
?
线性回归
什么是回归?哪些模型可用于解决回归问题? 什么是线性回归?什么时候使用它? 什么是正态分布?为什么要重视它? 如何检查变量是否遵循正态分布?
如何建立价格预测模型?价格是否正态分布?需要对价格进行预处理吗? 解决线性回归的模型有哪些? 什么是梯度下降?它是如何工作的? 什么是正规方程?
什么是SGD-随机梯度下降?与通常的梯度下降有何不同? 有哪些评估回归模型的指标? 什么是MSE和RMSE?
? ? ? ? ? ? ? ? ? ? ?
验证方式
什么是过拟合? 如何验证模型?
为什么需要将数据分为三个部分:训练,验证和测试? 解释交叉验证的工作原理? 什么是K折交叉验证?
如何在K折交叉验证中选择K?你最喜欢的K是什么?
? ? ? ? ? ?
分类
什么是分类?哪些模型可以解决分类问题? 什么是逻辑回归?什么时候需要使用它? Logistic回归是线性模型吗?为什么? 什么是Sigmoid?它有什么作用? 如何评估分类模型? 什么是准确性?
准确性始终是一个好的指标吗? 什么是混淆表?表中的单元格表示什么? 什么是精度,召回率和F1分数? 准确率和召回率的权衡
什么是ROC曲线?什么时候使用? 什么是AUC(AU ROC)?什么时候使用?
? ? ? ? ? ? ? ? ? ? ? ?