Skip to content

Latest commit

 

History

History
263 lines (186 loc) · 25.5 KB

File metadata and controls

263 lines (186 loc) · 25.5 KB

数据科学初学者课程

在 GitHub Codespaces 中打开

GitHub 许可证 GitHub 贡献者 GitHub 问题 GitHub 拉取请求 欢迎 PR

GitHub 观察者 GitHub 分支 GitHub 星标

Microsoft Foundry Discord

Microsoft Foundry Developer Forum

微软 Azure 云倡导者很高兴提供一个为期10周、共20课的完整数据科学课程。每课均包含课前和课后测验、完成课程所需的书面说明、一个解决方案和一个作业。我们的项目驱动教学法使您在构建中学习,这是新技能“扎根”的有效方法。

衷心感谢我们的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison

🙏 特别感谢 🙏 我们的 Microsoft 学生大使 作者、审核者和内容贡献者, 尤其是 Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi

由 @sketchthedocs 制作的草图笔记 https://sketchthedocs.dev
数据科学初学者 - @nitya 制作的草图笔记

🌐 多语言支持

通过 GitHub Action 支持(自动且始终保持最新)

阿拉伯语 | 孟加拉语 | 保加利亚语 | 缅甸语(缅甸) | 中文(简体) | 中文(繁体,香港) | 中文(繁体,澳门) | 中文(繁体,台湾) | 克罗地亚语 | 捷克语 | 丹麦语 | 荷兰语 | 爱沙尼亚语 | 芬兰语 | 法语 | 德语 | 希腊语 | 希伯来语 | 印地语 | 匈牙利语 | 印度尼西亚语 | 意大利语 | 日语 | 卡纳达语 | 韩语 | 立陶宛语 | 马来语 | 马拉雅拉姆语 | 马拉地语 | 尼泊尔语 | 尼日利亚皮钦语 | 挪威语 | 波斯语(法尔西) | 波兰语 | 葡萄牙语(巴西) | 葡萄牙语(葡萄牙) | 旁遮普语(古鲁穆奇文) | 罗马尼亚语 | 俄语 | 塞尔维亚语(西里尔文) | 斯洛伐克语 | 斯洛文尼亚语 | 西班牙语 | 斯瓦希里语 | 瑞典语 | 他加禄语(菲律宾语) | 泰米尔语 | 泰卢固语 | 泰语 | 土耳其语 | 乌克兰语 | 乌尔都语 | 越南语

更倾向于本地克隆?

本仓库包含50多种语言的翻译,显著增加了下载大小。若想克隆时不包含翻译,可以使用稀疏检出:

Bash / macOS / Linux:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD(Windows):

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

这将为您提供完成课程所需的所有内容,且下载速度更快。

如果您希望支持额外的翻译语言,支持列表见 此处

加入我们的社区

Microsoft Foundry Discord

我们正在进行 Discord 上的“与 AI 学习”系列,详情及加入请访问 与 AI 学习系列,时间为2025年9月18日-30日。您将获得使用 GitHub Copilot 进行数据科学的技巧和窍门。

与 AI 学习系列

你是学生吗?

请从以下资源开始:

  • 学生中心页面 在此页面,您会找到适合初学者的资源、学生包,甚至获得免费证书凭证的方式。请收藏并不时查看该页面,因为我们至少每月更新一次内容。
  • 微软学习学生大使 加入全球学生大使社区,这可能是您进入微软的途径。

入门指南

📚 文档

👨‍🎓 学生专用

完全初学者:刚接触数据科学?请从我们的适合初学者的示例开始!这些简洁、注释详尽的示例将帮助您理解基础知识,再深入学习完整课程。 学生们:若想自行使用本课程,请 fork 整个仓库,自行完成练习,从课前测验开始。然后阅读讲义,完成其余活动。建议通过理解课程内容自己动手创作项目,而非复制解决方案代码;不过,每个项目导向课程中均提供了 /solutions 文件夹的代码。另一个主意是组建学习小组,与朋友们一同学习。进一步学习建议使用 Microsoft Learn

快速开始:

  1. 查阅 安装指南 设置环境
  2. 浏览 使用指南 学习如何使用课程
  3. 从第一课开始,按顺序学习
  4. 加入我们的 Discord 社区 寻求支持

👩‍🏫 教师专用

教师:我们在为教师准备的一些建议中包含了如何使用本课程的信息。我们非常欢迎您在讨论论坛中提供反馈!

团队介绍

宣传视频

Gif作者 Mohit Jaisal

🎥 点击上方图片观看关于项目和创作者的视频!

教学法

我们在构建本课程时选择了两个教学原则:确保课程以项目为基础,并包含频繁的测验。在本系列结束时,学生将学习数据科学的基本原理,包括伦理概念、数据准备、不同的数据处理方式、数据可视化、数据分析、数据科学的现实应用案例等。

此外,课前的低风险测验有助于学生明确学习主题的意图,而课后的第二次测验则确保进一步巩固知识。本课程设计灵活有趣,可以全部完成或部分学习。项目由浅入深,随着10周学习周期进展逐渐复杂。

查看我们的行为守则贡献指南翻译指南。我们欢迎您的建设性反馈!

每节课包括:

  • 可选的手绘笔记
  • 可选的辅助视频
  • 课前热身测验
  • 书面课程材料
  • 以项目为基础的课程含有构建项目的逐步指南
  • 知识点检测
  • 一个挑战
  • 补充阅读
  • 作业
  • 课后测验

关于测验的说明:所有测验均保存在 Quiz-App 文件夹中,共40个测验,每个三题。测验链接嵌入课程中,但测验应用可以本地运行或部署到Azure;请参阅 quiz-app 文件夹中的说明。测验正在逐步本地化。

🎓 适合初学者的示例

刚接触数据科学? 我们创建了一个特别的示例目录,包含简单且注释详尽的代码,帮助您入门:

  • 🌟 Hello World - 您的第一个数据科学程序
  • 📂 加载数据 - 学习读取和探索数据集
  • 📊 简单分析 - 计算统计量并发现模式
  • 📈 基础可视化 - 创建图表和曲线图
  • 🔬 真实项目 - 从开始到完成的完整工作流程

每个示例都包含详细的注释,解释每一步,非常适合绝对初学者!

👉 从示例开始 👈

课程列表

 @sketchthedocs 的手绘笔记 https://sketchthedocs.dev
数据科学初学者路线图 - 手绘笔记作者 @nitya
课程编号 主题 课程归类 学习目标 关联课程 作者
01 定义数据科学 介绍 了解数据科学的基本概念,以及其与人工智能、机器学习和大数据的关系。 课程 视频 Dmitry
02 数据科学伦理 介绍 数据伦理的概念、挑战与框架。 课程 Nitya
03 定义数据 介绍 数据如何分类及其常见来源。 课程 Jasmine
04 统计与概率介绍 介绍 使用概率和统计的数学技术理解数据。 课程 视频 Dmitry
05 关系型数据处理 数据处理 介绍关系型数据及使用结构化查询语言(SQL,读作“sequel”)探索和分析关系型数据的基础知识。 课程 Christopher
06 NoSQL数据处理 数据处理 介绍非关系型数据、其各种类型及文档数据库的探索和分析基础。 课程 Jasmine
07 Python数据处理 数据处理 使用Python和Pandas库进行数据探索的基础。建议有Python编程基础。 课程 视频 Dmitry
08 数据准备 数据处理 关于数据清洗和转换的技术,处理缺失、不准确或不完整数据的挑战。 课程 Jasmine
09 数量可视化 数据可视化 学习使用Matplotlib可视化鸟类数据 🦆 课程 Jen
10 数据分布可视化 数据可视化 在区间内可视化观察数据和趋势。 课程 Jen
11 比例可视化 数据可视化 可视化离散和分组百分比。 课程 Jen
12 关系可视化 数据可视化 可视化数据集及其变量之间的连接和相关性。 课程 Jen
13 有意义的可视化 数据可视化 制作有价值的可视化以促进有效的问题解决和洞察的技术与指导。 课程 Jen
14 数据科学生命周期介绍 生命周期 介绍数据科学生命周期及其数据采集和提取的第一步。 课程 Jasmine
15 数据分析 生命周期 数据科学生命周期中聚焦于数据分析的阶段。 课程 Jasmine
16 交流 生命周期 数据科学生命周期中专注于以使决策者更易理解的方式呈现数据洞察的阶段。 课程 Jalen
17 云端数据科学 云端数据 介绍云端数据科学及其好处的系列课程。 课程 TiffanyMaud
18 云端数据科学 云端数据 使用低代码工具训练模型。 课程 TiffanyMaud
19 云端数据科学 云端数据 使用 Azure 机器学习工作室部署模型。 课程 TiffanyMaud
20 现实世界数据科学 现实世界 现实世界中由数据科学驱动的项目。 课程 Nitya

GitHub Codespaces

按照以下步骤在 Codespace 中打开此示例:

  1. 点击 Code 下拉菜单,选择 Open with Codespaces。
  2. 在面板底部选择 + New codespace。 更多信息请查看GitHub文档

VSCode Remote - 容器

按照以下步骤,使用本地机器和 VSCode 通过 VS Code Remote - Containers 扩展在容器中打开此仓库:

  1. 如果首次使用开发容器,请确认系统满足前提条件(例如安装了 Docker),详见入门文档

要使用此仓库,您可以选择在隔离的 Docker 卷中打开仓库:

注意:底层会使用 Remote-Containers: Clone Repository in Container Volume... 命令将源代码克隆到 Docker 卷中,而非本地文件系统。是持久化容器数据的推荐机制。

或者打开本地克隆或下载的仓库版本:

  • 将仓库克隆到本地文件系统。
  • 按 F1 并选择 Remote-Containers: Open Folder in Container... 命令。
  • 选择本地克隆的文件夹,等待容器启动,开始体验。

离线访问

您可以使用 Docsify 离线运行本文档。Fork 本仓库,在本地安装 Docsify,之后在仓库根目录输入 docsify serve。网站将在本地 localhost:3000 的3000端口提供访问。

注意,笔记本文件不会通过 Docsify 渲染,运行笔记本时请在 VS Code 中启动 Python 内核单独运行。

其他课程

我们的团队还制作了其他课程!请查看:

LangChain

针对初学者的LangChain4j LangChain.js for Beginners LangChain for Beginners

Azure / Edge / MCP / Agents

AZD for Beginners Edge AI for Beginners MCP for Beginners AI Agents for Beginners


Generative AI Series

Generative AI for Beginners Generative AI (.NET) Generative AI (Java) Generative AI (JavaScript)


Core Learning

ML for Beginners Data Science for Beginners AI for Beginners Cybersecurity for Beginners Web Dev for Beginners IoT for Beginners XR Development for Beginners


Copilot Series

Copilot for AI Paired Programming Copilot for C#/.NET Copilot Adventure

Getting Help

遇到问题? 查看我们的故障排除指南,解决常见问题。

如果你遇到困难或对构建 AI 应用有任何疑问,加入学习者和有经验开发者的讨论,共同探讨 MCP。这里是一个支持性的社区,欢迎提问并自由分享知识。

Microsoft Foundry Discord

如果你在构建过程中有产品反馈或遇到错误,请访问:

Microsoft Foundry Developer Forum


免责声明
本文件使用AI翻译服务Co-op Translator进行翻译。尽管我们力求准确,但请注意,自动翻译可能包含错误或不准确之处。原始母语文档应被视为权威来源。对于重要信息,建议使用专业人工翻译。对于因使用本翻译而产生的任何误解或误释,我们不承担任何责任。