Skip to content

Latest commit

 

History

History
119 lines (63 loc) · 9.91 KB

more-tips-for-successfully-navigating-beginner-data-science-job-interviews.md

File metadata and controls

119 lines (63 loc) · 9.91 KB

更多成功导航初级数据科学职位面试的技巧

原文:www.kdnuggets.com/more-tips-for-successfully-navigating-beginner-data-science-job-interviews

更多成功导航初级数据科学职位面试的技巧

之前的九条建议涵盖了对初级数据科学家较为明显的建议。


我们的前三大课程推荐

1. Google 网络安全证书 - 加速你的网络安全职业生涯

2. Google 数据分析专业证书 - 提升你的数据分析技能

3. Google IT 支持专业证书 - 支持你的组织的 IT


接下来的面试技巧涉及到将自己塑造成最佳候选人的更细微方面。

基于我之前的文章,这些额外的技巧将进一步提升你在初级数据科学职位面试中的成功机会。

1. 准备一个作品集

创建一个数据科学项目作品集是展示你作为数据科学家能力的最佳方式之一。

对于初学者来说,选择适合的项目来构建作品集可能会很困难。这里有一些数据科学项目创意作为开始。你也可以参考Datacamp 的建议StrataScratch 上的数据项目

更多成功导航初级数据科学职位面试的技巧

2. 使用领域知识练习编码

领域知识意味着你对特定行业、部门或主题领域有深入了解。这些知识包括该领域的复杂性、挑战、术语、流程和细微差别。

更多成功导航初级数据科学职位面试的技巧

这必须在你的编码技能中体现出来,因为你将使用这些技能来解决特定公司在特定行业中的问题。

当你练习编码时,最好是在你面试的公司提供的实际问题上进行。我在第一篇文章中提到了StrataScratchLeetCode

当然,你可以在不直接来自面试的问题上进行练习。但是当你选择时,尽量找到数据科学面试问题和相关行业的数据集。比如,你正在面试 Meta(科技行业)和 Pfizer(制药行业)。这些公司处理的数据完全不同,数据行为也不同。自然,问题也会不同。所以,对 Meta 使用科技/社交媒体数据,对 Pfizer 使用制药数据。

通过这种方式,你也在确保你在提升领域知识。你可能会遇到一些你不熟悉的特定数据,因此你需要学习它以及它在行业中的重要性。

现在,你正在将编码与领域知识相结合!

3. 展示你的数据讲故事技能

数据讲故事意味着你可以清晰易懂地传达你数据项目的见解。考虑一下你为什么开始了某个项目以及你取得了什么成果;其中总有一个故事。

通过为你的项目创建一个故事,你会让数据对非技术人员更易于理解。作为回报,你将在决策过程中拥有更多的影响力。

这里有一些展示这一技能的技巧。

创建叙事: 任何好的故事都有一个弧线:引言、问题、上升动作、高潮、跌行动作和解决方案。在讲述你的数据故事时,包含这些元素。

你可以从业务背景开始,例如:“公司在过去三年推出了五款新产品。”然后是问题。你注意到销售在增长,但客户留存率却没有。现在,你需要深入数据,尝试找到留存问题的原因。在这里,你的故事应该深入探讨项目的技术方面:你做了什么为什么。高潮是当你发现一款产品的销售额很高,但退货率也很高。跌行动作是你讨论高退货的潜在原因。在解决方案中,你提出了产品改进的建议。在解决方案中,直接关联你的项目做了什么,并量化其成就。不要让你的故事以你给出产品改进建议结束,而是讲述那款产品的销售增长,给公司带来了多少钱等。

使用清晰的可视化图表: 使用支持你故事的可视化图表。

在你关于过去几年销售趋势的项目中,不要只是展示一个包含每月销售数据的表格。相反,使用折线图来直观地表示销售的波动。这样,观众将能够把握趋势。对于销售的显著峰值,使用柱状图将销售按产品或产品类别分解,突出显示哪些产品推动了峰值。

避免使用行话并简化复杂概念: 只有在必要时才使用技术术语。重点是要向商业人士“推销”你的想法和项目,因此需要简化复杂概念。不要说,“残差中的异方差性表明我们的线性回归模型可能不适合。”相反,应该说,“我们数据中的模式表明我们的初始模型可能未能有效捕捉所有信息。”这样会更好!

4. 讨论失败和学习

我们都会犯错。错误是学习过程中的必要部分。面试官并不寻求完美的候选人;他们在寻找愿意并能够学习的人。

让面试官了解你这一方面。如果你诚实地分享你的失败以及从中学到的东西,会建立信任,并展示你的挫折恢复能力。

以下是一些如何谈论这个话题的建议。

避免责备他人: 避免将错误归咎于他人和一切事物。当然,要说明超出你控制范围的情况,但不要表现出受害者。对你自己部分的责任负责,展示你从这些情况中学到的东西,并谈谈你本该如何做得更好。

强调学习,而不是失败: 谈论失败的目的应仅仅是展示你从中学到了什么,因此要集中讲述这一点。

谈论经验: 从你之前的工作中找一个真实的例子。即使它不是数据科学相关的,如果它展示了你对学习和自我意识的关注,也可能适用。如果你没有工作经验,可以谈谈你在数据项目中犯的错误以及学到的东西。

谈论你采取的步骤: 这与您纠正错误或减少其影响的做法有关,例如,改变数据、调整算法,或完全放弃该项目并开始一个新项目。

这里是你(Y)和面试官(I)之间对话的可能样子。

I: “你能告诉我一个项目或任务没有按计划进行的例子,以及你是如何处理的吗?”

Y: 当然!在我之前担任数据科学家的角色时,我负责一个旨在预测客户流失的项目。我根据最初的理解选择了 k 最近邻算法并使用了它。然而,结果并不像我期望的那样准确。

I: 为什么?你意识到时做了什么?

Y: 有一些数据不一致,截止日期非常紧迫,所以我的 EDA 不够详细。尽管如此,我现在意识到我应该做得更详细。发现不一致后,我与数据质量团队合作,进一步了解这些问题。我还探索了其他算法并进行了评估。最后,我切换到了 XGBoost 算法,这显著提高了模型的预测准确性。我学到了不要低估 EDA 的重要性。我也很高兴我敢于承认错误,并从头开始,明白一个我们无法信任的模型是没有用的。

结论

数据科学不仅仅是无脑的数据处理和代码编写。这涉及到能够通过数据讲故事和可视化将你的工作转化为普通人的语言。

你需要在面试中展示这一点。你必须确保你能说得出,但也能证明你能做得出。做到这一点的最佳方法是拥有一个扎实的数据项目组合,你的编码、讲故事和可视化技能将显而易见。

在项目过程中,你会犯错误。不要隐瞒这些错误。公开谈论它们,并从你的面试官那里寻求反馈。

这归结为两件简单的事情:要有能力,并且诚实地讲述你是如何达到这个能力的。说起来容易,做起来难!

但是,通过我在这篇文章中给出的提示,我相信你会在下次数据科学面试中表现出色!

****内特·罗斯迪****是一名数据科学家,专注于产品策略。他也是一名兼职教授,教授分析课程,并且是 StrataScratch 的创始人,该平台帮助数据科学家通过来自顶尖公司的真实面试问题准备面试。内特撰写有关职业市场的最新趋势,提供面试建议,分享数据科学项目,并涵盖所有 SQL 内容。

更多相关话题