title | slug | description | author | status | created_at | updated_at |
---|---|---|---|---|---|---|
AI工程师养成指南:从机器学习到大模型开发 |
ai-engineer-course |
系统化的AI工程师培养课程,涵盖机器学习、深度学习、大模型开发及工程实践,助力开发者从入门到精通 |
AI 学习团队 |
published |
2024-01-01 |
2024-01-01 |
本课程面向具备Python基础的开发者,提供一个完整的AI工程师培养体系。从机器学习基础到深度学习,再到大模型开发与工程实践,采用理论与实战相结合的方式,帮助学习者构建完整的AI技术知识体系,掌握大模型开发技能。
- 掌握机器学习与深度学习的核心原理
- 熟练运用现代AI开发工具与框架
- 具备大模型开发与优化能力
- 培养AI工程化实践能力
-
1. Python编程基础
- Python和NumPy基础
- 并发与异步编程
- 包管理与环境配置
- 实践:异步数据处理
-
2. 数学基础入门
- 线性代数基础(向量、矩阵运算)
- 微积分要点(导数、梯度)
- 概率统计基础(概率分布、期望方差)
- 信息论基础(熵、互信息)
- 实践:Python实现数学运算
-
3. 开发工具与最佳实践
- Git版本控制
- 单元测试与CI/CD
- 代码质量与文档
- Docker容器化
- 实践:工程化项目搭建
本课程旨在培养具有实践能力的机器学习工程师,通过理论学习和实战项目,系统地掌握机器学习的核心概念、算法原理和工程实践。
- 理论与实践结合:每个主题都包含理论讲解和配套的代码实现
- 项目驱动学习:通过实际项目来加深对算法的理解
- 工程化思维:注重代码质量、性能优化和工程最佳实践
- 前沿技术:覆盖传统机器学习算法到最新的集成学习方法
- Python编程基础
- Python基础语法
- NumPy数组操作
- Pandas数据分析
- 数据可视化
- 实践:数据分析项目
-
机器学习概论
-
数据预处理与特征工程
-
回归算法基础
- 线性回归详解:原理、实现、优化
- 高级回归模型:多项式回归、SVR、决策树回归
- 集成回归模型:随机森林回归、梯度提升回归
- 模型评估与诊断:残差分析、模型假设检验
- 实践:房价预测系统
-
分类算法
- 分类算法概述:常用分类算法对比
- 线性分类器:逻辑回归、线性判别分析
- 非线性分类器:KNN、SVM、决策树
- 概率分类器:朴素贝叶斯、高斯判别
- 实践:客户流失预测
-
无监督学习
-
集成学习与模型选择
- 集成学习基础:Bagging、Boosting、Stacking
- XGBoost与LightGBM:原理与调优
- 模型选择与评估:网格搜索、随机搜索
- 超参数优化:贝叶斯优化、遗传算法
- 实践:模型集成与调优
- 深度学习导论
- 神经网络基础
- 反向传播算法
- 激活函数与优化器
- 实践:手写数字识别
- 机器学习系统设计
- 系统架构设计
- 模型部署与服务化
- 性能优化与监控
- 实践:在线预测服务
-
4. 数据分析与处理
- Pandas高级操作
- 数据清洗与转换
- 探索性数据分析
- 实践:数据分析报告
-
5. 高性能计算
- NumPy优化技巧
- 并行计算基础
- GPU加速入门
- 实践:大规模数据处理
-
6. 可视化与监控
- 静态可视化(Matplotlib/Seaborn)
- 交互式可视化(Plotly)
- 实验监控(TensorBoard/MLflow)
- 项目:数据可视化平台
-
16. 深度学习理论
- 神经网络基础
- 优化算法
- 激活函数
- 实践:手写神经网络
-
17. 深度学习框架
- PyTorch基础
- 自动微分
- 模型构建模式
- 实践:框架使用
-
18. 计算机视觉基础
- CNN架构
- 图像处理基础
- 迁移学习
- 项目:图像分类系统
-
19. NLP基础
- 文本预处理
- 词向量技术
- 语言模型基础
- 实践:文本分类
-
20. 序列模型
- RNN与LSTM
- 注意力机制
- Seq2Seq模型
- 项目:机器翻译
-
21. Transformer架构
- 自注意力机制
- 位置编码
- 多头注意力
- 实践:Transformer实现
-
22. 预训练语言模型
- BERT原理与应用
- GPT系列模型
- 领域适应
- 项目:文本生成
-
23. 大模型基础
- 大模型发展历程
- 架构设计原理
- 训练与推理流程
- 实践:模型部署
-
24. 提示工程
- 提示设计模式
- 上下文学习
- 提示优化策略
- 项目:对话系统
-
25. 大模型训练
- 分布式训练基础
- 混合精度训练
- 梯度累积与检查点
- 实践:模型训练
-
26. 模型优化技术
- 知识蒸馏
- 模型量化
- 模型剪枝
- 项目:模型压缩
-
27. 高性能服务
- 服务架构设计
- 负载均衡
- 缓存策略
- 实践:高并发服务
-
28. 大模型应用开发
- API设计
- 链式调用
- 多模态集成
- 项目:AI应用开发
-
29. 监控与运维
- 性能监控
- 资源管理
- 错误处理
- 实践:运维系统
-
30. 新兴模型架构
- MoE模型
- 稀疏注意力
- 长序列建模
- 实践:架构实验
-
31. 多模态学习
- 视觉-语言模型
- 跨模态注意力
- 多模态对齐
- 项目:多模态应用
-
32. 强化学习基础
- 策略优化
- 值函数方法
- 模型基础RL
- 实践:简单游戏AI
- 《机器学习》周志华
- 《统计学习方法》李航
- "Pattern Recognition and Machine Learning" by Bishop
- "Deep Learning" by Goodfellow et al.
- Coursera机器学习课程
- Stanford CS229/CS224N
- Fast.ai深度学习课程
- Python 3.8+
- 核心库:NumPy, Pandas, Scikit-learn
- 深度学习:PyTorch/TensorFlow
- 工具链:Git, Docker, MLflow
- 课程作业 (40%)
- 项目实践 (40%)
- 课堂参与 (20%)
每个模块包含:
- 理论作业
- 编程实践
- 案例分析
- 小组讨论