AI工程师养成指南：从机器学习到大模型开发

title	slug	description	author	status	created_at	updated_at
AI工程师养成指南：从机器学习到大模型开发	ai-engineer-course	系统化的AI工程师培养课程，涵盖机器学习、深度学习、大模型开发及工程实践，助力开发者从入门到精通	AI 学习团队	published	2024-01-01	2024-01-01

AI工程师养成指南：从机器学习到大模型开发

课程概述

本课程面向具备Python基础的开发者，提供一个完整的AI工程师培养体系。从机器学习基础到深度学习，再到大模型开发与工程实践，采用理论与实战相结合的方式，帮助学习者构建完整的AI技术知识体系，掌握大模型开发技能。

课程目标

掌握机器学习与深度学习的核心原理
熟练运用现代AI开发工具与框架
具备大模型开发与优化能力
培养AI工程化实践能力

课程大纲

第0章预备知识（2周，必修）

1. Python编程基础
- Python和NumPy基础
- 并发与异步编程
- 包管理与环境配置
- 实践：异步数据处理
2. 数学基础入门
- 线性代数基础（向量、矩阵运算）
- 微积分要点（导数、梯度）
- 概率统计基础（概率分布、期望方差）
- 信息论基础（熵、互信息）
- 实践：Python实现数学运算
3. 开发工具与最佳实践
- Git版本控制
- 单元测试与CI/CD
- 代码质量与文档
- Docker容器化
- 实践：工程化项目搭建

第1章机器学习工程师培训课程

本课程旨在培养具有实践能力的机器学习工程师，通过理论学习和实战项目，系统地掌握机器学习的核心概念、算法原理和工程实践。

课程特点

理论与实践结合：每个主题都包含理论讲解和配套的代码实现
项目驱动学习：通过实际项目来加深对算法的理解
工程化思维：注重代码质量、性能优化和工程最佳实践
前沿技术：覆盖传统机器学习算法到最新的集成学习方法

课程大纲

第1章先修知识准备（2周）

Python编程基础
- Python基础语法
- NumPy数组操作
- Pandas数据分析
- 数据可视化
- 实践：数据分析项目

第2章机器学习基础与算法（8周）

机器学习概论
- 什么是机器学习：机器学习的定义、类型、应用场景
- 学习理论基础：泛化能力、过拟合、欠拟合
- 模型评估方法：交叉验证、性能指标
- Python机器学习环境搭建：工具链配置、开发环境设置
- 实践：完整ML流程演示
数据预处理与特征工程
- 数据预处理基础：数据清洗、转换、规范化
- 特征工程实践指南：特征创建、选择、变换
- 特征选择与提取：过滤法、包装法、嵌入法
- 特征变换与编码：标准化、归一化、独热编码
- 特征交叉与组合：自动特征工程、特征组合
- 实践：构建特征工程Pipeline
回归算法基础
- 线性回归详解：原理、实现、优化
- 高级回归模型：多项式回归、SVR、决策树回归
- 集成回归模型：随机森林回归、梯度提升回归
- 模型评估与诊断：残差分析、模型假设检验
- 实践：房价预测系统
分类算法
- 分类算法概述：常用分类算法对比
- 线性分类器：逻辑回归、线性判别分析
- 非线性分类器：KNN、SVM、决策树
- 概率分类器：朴素贝叶斯、高斯判别
- 实践：客户流失预测
无监督学习
- 聚类算法：K-means、层次聚类、DBSCAN
- 降维技术：PCA、LDA、t-SNE
- 异常检测：基于统计、基于密度、基于距离
- 关联分析：Apriori、FP-Growth
- 实践：客户分群分析
集成学习与模型选择
- 集成学习基础：Bagging、Boosting、Stacking
- XGBoost与LightGBM：原理与调优
- 模型选择与评估：网格搜索、随机搜索
- 超参数优化：贝叶斯优化、遗传算法
- 实践：模型集成与调优

第3章深度学习基础（4周）

深度学习导论
- 神经网络基础
- 反向传播算法
- 激活函数与优化器
- 实践：手写数字识别

第4章工程实践（4周）

机器学习系统设计
- 系统架构设计
- 模型部署与服务化
- 性能优化与监控
- 实践：在线预测服务

第2章数据科学基础（3周）

4. 数据分析与处理
- Pandas高级操作
- 数据清洗与转换
- 探索性数据分析
- 实践：数据分析报告
5. 高性能计算
- NumPy优化技巧
- 并行计算基础
- GPU加速入门
- 实践：大规模数据处理
6. 可视化与监控
- 静态可视化（Matplotlib/Seaborn）
- 交互式可视化（Plotly）
- 实验监控（TensorBoard/MLflow）
- 项目：数据可视化平台

第3章深度学习基础（4周）

16. 深度学习理论
- 神经网络基础
- 优化算法
- 激活函数
- 实践：手写神经网络
17. 深度学习框架
- PyTorch基础
- 自动微分
- 模型构建模式
- 实践：框架使用
18. 计算机视觉基础
- CNN架构
- 图像处理基础
- 迁移学习
- 项目：图像分类系统

第4章自然语言处理（6周）

19. NLP基础
- 文本预处理
- 词向量技术
- 语言模型基础
- 实践：文本分类
20. 序列模型
- RNN与LSTM
- 注意力机制
- Seq2Seq模型
- 项目：机器翻译
21. Transformer架构
- 自注意力机制
- 位置编码
- 多头注意力
- 实践：Transformer实现
22. 预训练语言模型
- BERT原理与应用
- GPT系列模型
- 领域适应
- 项目：文本生成

第5章大模型开发（6周）

23. 大模型基础
- 大模型发展历程
- 架构设计原理
- 训练与推理流程
- 实践：模型部署
24. 提示工程
- 提示设计模式
- 上下文学习
- 提示优化策略
- 项目：对话系统
25. 大模型训练
- 分布式训练基础
- 混合精度训练
- 梯度累积与检查点
- 实践：模型训练
26. 模型优化技术
- 知识蒸馏
- 模型量化
- 模型剪枝
- 项目：模型压缩

第6章工程实践（4周）

27. 高性能服务
- 服务架构设计
- 负载均衡
- 缓存策略
- 实践：高并发服务
28. 大模型应用开发
- API设计
- 链式调用
- 多模态集成
- 项目：AI应用开发
29. 监控与运维
- 性能监控
- 资源管理
- 错误处理
- 实践：运维系统

第7章前沿技术（选修，4周）

30. 新兴模型架构
- MoE模型
- 稀疏注意力
- 长序列建模
- 实践：架构实验
31. 多模态学习
- 视觉-语言模型
- 跨模态注意力
- 多模态对齐
- 项目：多模态应用
32. 强化学习基础
- 策略优化
- 值函数方法
- 模型基础RL
- 实践：简单游戏AI

课程资源

在线资源

Coursera机器学习课程
Stanford CS229/CS224N
Fast.ai深度学习课程

开发环境

Python 3.8+
核心库：NumPy, Pandas, Scikit-learn
深度学习：PyTorch/TensorFlow
工具链：Git, Docker, MLflow

评估方式

课程作业 (40%)
项目实践 (40%)
课堂参与 (20%)

结业项目要求

每个模块包含：

理论作业
编程实践
案例分析
小组讨论

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
advanced-topics		advanced-topics
applications		applications
case-studies		case-studies
classic-ml		classic-ml
data-science		data-science
deep-learning		deep-learning
docs		docs
engineering		engineering
foundations		foundations
llm		llm
ml-basics		ml-basics
prerequisites		prerequisites
source		source
tools		tools
.env.example		.env.example
.gitignore		.gitignore
.windsurfrules		.windsurfrules
README.md		README.md
contributing-guide.md		contributing-guide.md
tutorial-standards.md		tutorial-standards.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI工程师养成指南：从机器学习到大模型开发

课程概述

课程目标

课程大纲

第0章预备知识（2周，必修）

第1章机器学习工程师培训课程

课程特点

课程大纲

第1章先修知识准备（2周）

第2章机器学习基础与算法（8周）

第3章深度学习基础（4周）

第4章工程实践（4周）

第2章数据科学基础（3周）

第3章深度学习基础（4周）

第4章自然语言处理（6周）

第5章大模型开发（6周）

第6章工程实践（4周）

第7章前沿技术（选修，4周）

课程资源

推荐教材

在线资源

开发环境

评估方式

结业项目要求

About

Releases

Packages

Languages

learnagi/ai-engineer-course

Folders and files

Latest commit

History

Repository files navigation

AI工程师养成指南：从机器学习到大模型开发

课程概述

课程目标

课程大纲

第0章 预备知识（2周，必修）

第1章 机器学习工程师培训课程

课程特点

课程大纲

第1章 先修知识准备（2周）

第2章 机器学习基础与算法（8周）

第3章 深度学习基础（4周）

第4章 工程实践（4周）

第2章 数据科学基础（3周）

第3章 深度学习基础（4周）

第4章 自然语言处理（6周）

第5章 大模型开发（6周）

第6章 工程实践（4周）

第7章 前沿技术（选修，4周）

课程资源

推荐教材

在线资源

开发环境

评估方式

结业项目要求

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

第0章预备知识（2周，必修）

第1章机器学习工程师培训课程

第1章先修知识准备（2周）

第2章机器学习基础与算法（8周）

第3章深度学习基础（4周）

第4章工程实践（4周）

第2章数据科学基础（3周）

第3章深度学习基础（4周）

第4章自然语言处理（6周）

第5章大模型开发（6周）

第6章工程实践（4周）

第7章前沿技术（选修，4周）

Packages