Skip to content

Latest commit

 

History

History
119 lines (60 loc) · 12 KB

5-mistakes-data-science-career.md

File metadata and controls

119 lines (60 loc) · 12 KB

我希望在数据科学职业生涯中避免的 5 个错误

原文:www.kdnuggets.com/2021/07/5-mistakes-data-science-career.html

评论

Tessa Xie,Cruise 高级数据科学家


我们的前三大课程推荐

1. Google 网络安全证书 - 快速进入网络安全职业道路。

2. Google 数据分析专业证书 - 提升你的数据分析水平

3. Google IT 支持专业证书 - 支持你的组织的 IT


照片来源于 bruce mars ,发布于 Unsplash

当我第一次从金融转到数据科学时,我感觉自己站在了世界的顶端——我得到了理想领域的工作,职业轨迹已定,我只需低头努力工作,会有什么问题呢?实际上,有一些事情……在接下来的一年中,作为数据科学家,我犯了几个错误,我很高兴自己早早发现了这些错误。这样,我有时间反思并调整方向,避免了为时已晚。过了一段时间,我意识到这些错误相当普遍。事实上,我观察到很多数据科学家仍在犯这些错误,而未意识到这些错误可能会长期伤害他们的数据职业生涯。

如果我的5 Lessons McKinsey Taught Me That Will Make You a Better Data Scientist是我从最优秀的身上学到的,那么这篇文章中的教训是我通过艰难的方式学到的,我希望能帮助你避免犯同样的错误。

错误 1:将自己视为脚下的士兵而非思想合作伙伴

从小到大,我们总是根据我们遵循规则和指令的能力来评估,特别是在学校里。如果你按照教材和模拟考试进行练习并努力工作,你就会成为顶尖学生。许多人似乎把这种“步兵”心态带入工作环境。在我看来,这正是阻碍许多数据科学家最大化影响力并从同事中脱颖而出的心态。我观察到很多数据科学家,尤其是初级的,认为他们对决策过程没有贡献,宁愿退到背景中,消极地执行为他们做出的决策。这开启了一个恶性循环——你对这些讨论的贡献越少,利益相关者就越不可能让你参与未来的会议,你将获得的贡献机会也会越少。

让我举一个在模型开发中步兵和思想伙伴之间区别的具体例子。在数据收集和特征头脑风暴会议中,我以前会消极地记录利益相关者的建议,以便后来可以“完美”地实施它们。当有人提议一个我知道我们没有数据的特征时,我会因为假设他们更资深、一定知道我忽视的东西而不说任何话。但猜猜怎么着,他们并不知道。后来,我会遇到这样的问题:我们头脑风暴的 50%特征需要额外的数据收集,这将使我们的项目截止日期面临风险。结果,我常常发现自己处于最后的坏消息传播者的位置。现在为了成为思想伙伴,我会在对话中早早介入,并利用我作为离数据最近的人的独特位置。这种方式让我可以早早管理利益相关者的期望,并提出建议以帮助团队前进。

如何避免这一点:

  • 确保在你可以从数据角度贡献的会议中不要保留意见:利益相关者对指标的定义是否足够测量他们想要的东西?是否有数据可用来测量这组指标?如果没有,我们能否找到我们拥有数据的替代方案?

  • 冒名顶替综合症确实存在,尤其是在初级数据科学家中。确保你意识到这一点,无论何时你怀疑是否应该说出“别人可能已经想到”的话或问一个“愚蠢的澄清问题”,你都应该这样做。

  • 保持对其他人工作内容的好奇心。有很多情况下,我发现通过注意到其他人可能因为对公司数据理解不足而忽视的空白,我可以增加价值。

错误 2:把自己限制在数据科学的特定领域

我是想成为数据工程师还是数据科学家?我想处理市场营销和销售数据,还是做地理空间分析?你可能注意到,我在本文中一直使用“DS”这一术语,作为许多数据相关职业路径(例如数据工程师、数据科学家、数据分析师等)的通用称谓。这是因为在数据世界中,这些职称的界限变得模糊不清,尤其是在较小的公司里。我观察到许多数据科学家仅将自己视为构建模型的科学家,而不关注任何业务方面,或数据工程师只关注数据管道而不想了解公司中的建模情况。

最优秀的数据人才是那些能够扮演多种角色的人,或者至少能够理解其他数据角色的工作流程。这在你想要进入一个早期阶段或成长阶段的初创公司时尤其重要,因为在这些公司中,职能可能还不够专业化,你需要灵活应对,承担各种数据相关的职责。即使你在一个明确定义的工作岗位上,随着经验的积累,你可能会发现自己对转向不同类型的数据角色感兴趣。如果你没有将自己和你的技能局限于一个特定角色的狭窄领域,这种转变会更容易。

如何避免:

  • 再次,关注其他数据角色正在做的项目。定期安排与同事的会议,讨论有趣的项目,或者让不同的数据团队定期分享他们的工作/项目。

  • 如果你无法在工作中接触到其他数据角色,尝试在闲暇时间保持或练习你未使用的数据技能。例如,如果你是数据分析师,并且有一段时间没有接触建模,考虑通过参加像 Kaggle 比赛这样的外部项目来练习这些技能。

错误 3:未跟上领域的发展

自满会致命

每个士兵都知道这一点,每个 DS 也应当知道。对自己的数据技能感到自满,并不花时间学习新技能是一个常见的错误。在数据领域,这种情况比在其他领域更危险,因为数据科学是一个相对较新的领域,仍在经历急剧的变化和发展。不断有新的算法、新的工具,甚至新的编程语言被引入。

如果你不想成为那个在 2021 年仍然只会使用 STATA 的数据科学家(他确实存在,我曾与他合作过),那么你需要跟上该领域的发展。

不要成为这样的人 (GIF 由 GIPHY 提供)。

如何避免:

  • 报名参加在线课程,学习新概念和算法,或者复习你已经知道但在工作中久未使用的内容。学习能力是一项所有人都应该不断练习的技能,而终身学习可能是你能给予自己最好的礼物。

  • 订阅 DS 新闻通讯或关注 Medium 上的 DS 博主/出版物,并养成跟踪 DS “新闻”的习惯。

错误 4:过度发挥你的分析能力

如果你只有一把锤子,一切看起来都像钉子。不要成为那个试图对所有事物都使用机器学习的 DS。当我第一次进入数据科学领域时,我对在学校学到的所有新模型感到非常兴奋,迫不及待地想在现实世界的问题上尝试它们。但现实世界与学术研究不同,80/20 法则始终在发挥作用。

在我之前关于“麦肯锡教我的 5 个教训”的文章中,我提到商业影响和可解释性有时比模型的额外几个百分点准确率更为重要。有时,也许一个基于假设的 Excel 模型比多层神经网络更有意义。在这些情况下,不要过度发挥你的分析能力,使你的方法变得过于复杂。相反,发挥你的商业能力,成为一个同时具备商业洞察的 DS。

如何避免:

  • 在你的工具库中拥有全面的分析技能/工具,从简单的 Excel 到先进的机器学习建模技能,这样你才能在不同情况下评估哪个工具最合适,而不是在刀枪不入的情况下带上枪。

  • 在深入分析之前,了解业务需求。有时利益相关者会因为 ML 是一个流行概念而请求一个 ML 模型,他们对 ML 模型能做什么有不切实际的期望。作为 DS,你的工作是管理这些期望,并帮助他们找到更好、更简单的方法来实现他们的目标。记住?成为一个思想伙伴,而不是一个步兵。

错误 5:认为建立数据文化是其他人的工作

在我的文章“构建伟大数据文化的 6 个关键步骤”中,我写到,如果公司没有良好的数据文化,数据科学家的生活可能会变得糟糕而低效。事实上,我听到很多数据科学家抱怨那些应该由利益相关者自助处理的不必要的临时数据请求(例如,在 Looker 中将聚合从每月改为每日,实际上只需两次点击)。不要认为改变这种文化是别人的工作。如果你想看到改变,就去做。毕竟,谁比数据科学家更适合建立数据文化并教育利益相关者呢?帮助建立公司的数据文化将使你和你的利益相关者在未来的工作中轻松很多。

如何避免这些问题:

  • 让自己负责对非分析型利益相关者进行培训,并开发自助资源。

  • 确保你开始实践你所宣扬的内容,将查询链接到幻灯片,将真实数据源链接到文档,并开始记录你的代码和数据库。你无法一夜之间建立数据文化,所以这确实需要耐心。

我想指出的是,在职业生涯中犯错是可以的。最重要的是从这些错误中学习,并在未来避免它们。更好的是,将这些错误记录下来,帮助他人避免相同的错误。

原文。经许可转载。

简介:Tessa Xie是一位经验丰富的高级分析顾问,擅长数据科学、SQL、R、Python、消费者研究和经济研究,拥有强大的工程背景,硕士学位专注于金融工程,毕业于 MIT。

相关内容:

更多相关话题