原文:
www.kdnuggets.com/2021/09/data-scientist-without-stem-degree.html
评论
“数据科学”是一个模糊的术语——它对不同公司可能意味着不同的东西,而且有许多与数据科学家相关的技能。
也就是说,我推荐你学习一些核心技能。以下技能对任何数据科学家都至关重要:SQL、Python、统计学、机器学习。我也建议你按此顺序学习这些技能。虽然听起来很多,但这与大学时你每学期需要完成 4-6 门课程并无不同!
让我们深入探讨每个技能。
SQL 是数据的语言,无疑是任何数据科学家最重要的技能。SQL 用于操作数据、分析数据、构建仪表板、构建数据管道、编写查询以供模型使用等等。
Python(或任何脚本语言)作为基础,能够进行诸如构建 ML 模型、网络数据抓取、构建自动化脚本等多种操作。
Pandas 是一个用于数据操作和分析的 Python 库。我个人在 Jupyter notebook 中探索数据时更倾向于使用 Pandas 而不是 SQL。
以下是我学习 Python 和 Pandas 时用到的最有用的资源:
数据科学/机器学习本质上是统计学的现代版本。首先学习统计学,你会在学习机器学习概念和算法时轻松得多!尽管最初几周可能看起来没有实际收获,但后续的收益将会很值得。
以下是我学习统计学时用到的最有用的资源:
机器学习不仅有趣和激动人心,而且是所有数据科学家必须具备的技能。虽然建模占数据科学家时间的一小部分,但它的重要性不容忽视。
以下是我学习机器学习时用到的最有用的资源:
一旦你打下了基础,加速学习的最佳方式就是完成一些数据科学项目。最简单的方法是去Kaggle,选择一个数据集,创建一个预测模型或一些数据可视化。记住,你的前几个项目不会很出色!但重要的是你随着时间的推移如何进步。
这里有一些我过去完成的数据科学项目,你可以用来获得灵感!
当你继续学习和实践数据科学技能时,还有其他方法可以让自己成为更有价值的数据科学候选人,这也是我接下来要分享的建议。
成为数据科学家最困难的部分是如何在没有经验的情况下获得第一个机会。然而,以下是一些即使没有经验也可以获得经验的方法:
最近,我看到了一篇由苏珊·柯里·西维克(Susan Currie Sivek)撰写的资源丰富的文章, 提供了几个组织,你可以在这些组织中找到从事真实数据科学项目的机会。
如果你正在寻找更多的经验来丰富你的简历,我强烈推荐你查看这些。
在我看来,没有比通过比赛展示你已经准备好从事数据科学工作更好的方式了。Kaggle 举办了各种比赛,涉及构建模型以优化某些指标。
你现在可以尝试的两个比赛是:
是的,我有些偏颇,但请听我说。你会惊讶于 Medium 上有多少数据相关的专业人士。他们喜欢看到信息丰富、有见地和有趣的内容。利用 Medium 来撰写你的学习心得,解释复杂的话题,或者展示你的数据科学项目吧!
我特别建议你为出版物 Towards Data Science 撰写文章,因为他们目前拥有近 500,000 名关注者。
如果你需要一些灵感,可以查看我的项目演示,葡萄酒质量预测。
我知道我将面临艰难的挑战,尤其是没有作为数据科学家的经验。然而,寻找类似于数据科学家职位的工作将显著增加你成为数据科学家的机会。原因在于相关工作将给你在商业环境中处理实际数据的机会。
你不需要是数据科学家才能从事‘数据科学’工作
这里有一些你可以寻找的数据科学相关职位:
-
商业智能分析师
-
数据分析师
-
产品分析师
-
增长营销分析师 / 营销分析
-
定量分析师
除了上述两点,还有一个提示显著提高了我作为数据科学家的声誉。
大多数数据科学职位列表要求硕士学位,因为通常需要高水平的技术技能。如果你发现上述两个建议没有成功,我建议你考虑定量领域(计算机科学、统计学、数学、分析等)的硕士项目。
就个人而言,我选择了乔治亚理工学院的分析学硕士项目,原因有很多:
-
它不需要定量领域的学士学位。
-
如果你想同时工作和学习,它有一个在线项目。
-
整个项目只需$10K 美元。
尽管如此,市场上有几个选项,我强烈建议你在做出决定之前花时间探索所有选项!
相关: