Skip to content

系统化的AI工程师培养课程,涵盖机器学习、深度学习、大模型开发及工程实践,助力开发者从入门到精通

Notifications You must be signed in to change notification settings

learnagi/ai-engineer-course

Repository files navigation

title slug description author status created_at updated_at
AI工程师养成指南:从机器学习到大模型开发
ai-engineer-course
系统化的AI工程师培养课程,涵盖机器学习、深度学习、大模型开发及工程实践,助力开发者从入门到精通
AI 学习团队
published
2024-01-01
2024-01-01

AI工程师养成指南:从机器学习到大模型开发

课程概述

本课程面向具备Python基础的开发者,提供一个完整的AI工程师培养体系。从机器学习基础到深度学习,再到大模型开发与工程实践,采用理论与实战相结合的方式,帮助学习者构建完整的AI技术知识体系,掌握大模型开发技能。

课程目标

  1. 掌握机器学习与深度学习的核心原理
  2. 熟练运用现代AI开发工具与框架
  3. 具备大模型开发与优化能力
  4. 培养AI工程化实践能力

课程大纲

第0章 预备知识(2周,必修)

  • 1. Python编程基础

    • Python和NumPy基础
    • 并发与异步编程
    • 包管理与环境配置
    • 实践:异步数据处理
  • 2. 数学基础入门

    • 线性代数基础(向量、矩阵运算)
    • 微积分要点(导数、梯度)
    • 概率统计基础(概率分布、期望方差)
    • 信息论基础(熵、互信息)
    • 实践:Python实现数学运算
  • 3. 开发工具与最佳实践

    • Git版本控制
    • 单元测试与CI/CD
    • 代码质量与文档
    • Docker容器化
    • 实践:工程化项目搭建

第1章 机器学习工程师培训课程

本课程旨在培养具有实践能力的机器学习工程师,通过理论学习和实战项目,系统地掌握机器学习的核心概念、算法原理和工程实践。

课程特点

  • 理论与实践结合:每个主题都包含理论讲解和配套的代码实现
  • 项目驱动学习:通过实际项目来加深对算法的理解
  • 工程化思维:注重代码质量、性能优化和工程最佳实践
  • 前沿技术:覆盖传统机器学习算法到最新的集成学习方法

课程大纲

第1章 先修知识准备(2周)
第2章 机器学习基础与算法(8周)
  • 机器学习概论

    • 什么是机器学习:机器学习的定义、类型、应用场景
    • 学习理论基础:泛化能力、过拟合、欠拟合
    • 模型评估方法:交叉验证、性能指标
    • Python机器学习环境搭建:工具链配置、开发环境设置
    • 实践:完整ML流程演示
  • 数据预处理与特征工程

    • 数据预处理基础:数据清洗、转换、规范化
    • 特征工程实践指南:特征创建、选择、变换
    • 特征选择与提取:过滤法、包装法、嵌入法
    • 特征变换与编码:标准化、归一化、独热编码
    • 特征交叉与组合:自动特征工程、特征组合
    • 实践:构建特征工程Pipeline
  • 回归算法基础

    • 线性回归详解:原理、实现、优化
    • 高级回归模型:多项式回归、SVR、决策树回归
    • 集成回归模型:随机森林回归、梯度提升回归
    • 模型评估与诊断:残差分析、模型假设检验
    • 实践:房价预测系统
  • 分类算法

    • 分类算法概述:常用分类算法对比
    • 线性分类器:逻辑回归、线性判别分析
    • 非线性分类器:KNN、SVM、决策树
    • 概率分类器:朴素贝叶斯、高斯判别
    • 实践:客户流失预测
  • 无监督学习

    • 聚类算法:K-means、层次聚类、DBSCAN
    • 降维技术:PCA、LDA、t-SNE
    • 异常检测:基于统计、基于密度、基于距离
    • 关联分析:Apriori、FP-Growth
    • 实践:客户分群分析
  • 集成学习与模型选择

    • 集成学习基础:Bagging、Boosting、Stacking
    • XGBoost与LightGBM:原理与调优
    • 模型选择与评估:网格搜索、随机搜索
    • 超参数优化:贝叶斯优化、遗传算法
    • 实践:模型集成与调优
第3章 深度学习基础(4周)
  • 深度学习导论
    • 神经网络基础
    • 反向传播算法
    • 激活函数与优化器
    • 实践:手写数字识别
第4章 工程实践(4周)
  • 机器学习系统设计
    • 系统架构设计
    • 模型部署与服务化
    • 性能优化与监控
    • 实践:在线预测服务

第2章 数据科学基础(3周)

  • 4. 数据分析与处理

    • Pandas高级操作
    • 数据清洗与转换
    • 探索性数据分析
    • 实践:数据分析报告
  • 5. 高性能计算

    • NumPy优化技巧
    • 并行计算基础
    • GPU加速入门
    • 实践:大规模数据处理
  • 6. 可视化与监控

    • 静态可视化(Matplotlib/Seaborn)
    • 交互式可视化(Plotly)
    • 实验监控(TensorBoard/MLflow)
    • 项目:数据可视化平台

第3章 深度学习基础(4周)

  • 16. 深度学习理论

    • 神经网络基础
    • 优化算法
    • 激活函数
    • 实践:手写神经网络
  • 17. 深度学习框架

    • PyTorch基础
    • 自动微分
    • 模型构建模式
    • 实践:框架使用
  • 18. 计算机视觉基础

    • CNN架构
    • 图像处理基础
    • 迁移学习
    • 项目:图像分类系统

第4章 自然语言处理(6周)

  • 19. NLP基础

    • 文本预处理
    • 词向量技术
    • 语言模型基础
    • 实践:文本分类
  • 20. 序列模型

    • RNN与LSTM
    • 注意力机制
    • Seq2Seq模型
    • 项目:机器翻译
  • 21. Transformer架构

    • 自注意力机制
    • 位置编码
    • 多头注意力
    • 实践:Transformer实现
  • 22. 预训练语言模型

    • BERT原理与应用
    • GPT系列模型
    • 领域适应
    • 项目:文本生成

第5章 大模型开发(6周)

  • 23. 大模型基础

    • 大模型发展历程
    • 架构设计原理
    • 训练与推理流程
    • 实践:模型部署
  • 24. 提示工程

    • 提示设计模式
    • 上下文学习
    • 提示优化策略
    • 项目:对话系统
  • 25. 大模型训练

    • 分布式训练基础
    • 混合精度训练
    • 梯度累积与检查点
    • 实践:模型训练
  • 26. 模型优化技术

    • 知识蒸馏
    • 模型量化
    • 模型剪枝
    • 项目:模型压缩

第6章 工程实践(4周)

  • 27. 高性能服务

    • 服务架构设计
    • 负载均衡
    • 缓存策略
    • 实践:高并发服务
  • 28. 大模型应用开发

    • API设计
    • 链式调用
    • 多模态集成
    • 项目:AI应用开发
  • 29. 监控与运维

    • 性能监控
    • 资源管理
    • 错误处理
    • 实践:运维系统

第7章 前沿技术(选修,4周)

  • 30. 新兴模型架构

    • MoE模型
    • 稀疏注意力
    • 长序列建模
    • 实践:架构实验
  • 31. 多模态学习

    • 视觉-语言模型
    • 跨模态注意力
    • 多模态对齐
    • 项目:多模态应用
  • 32. 强化学习基础

    • 策略优化
    • 值函数方法
    • 模型基础RL
    • 实践:简单游戏AI

课程资源

推荐教材

  • 《机器学习》周志华
  • 《统计学习方法》李航
  • "Pattern Recognition and Machine Learning" by Bishop
  • "Deep Learning" by Goodfellow et al.

在线资源

  • Coursera机器学习课程
  • Stanford CS229/CS224N
  • Fast.ai深度学习课程

开发环境

  • Python 3.8+
  • 核心库:NumPy, Pandas, Scikit-learn
  • 深度学习:PyTorch/TensorFlow
  • 工具链:Git, Docker, MLflow

评估方式

  • 课程作业 (40%)
  • 项目实践 (40%)
  • 课堂参与 (20%)

结业项目要求

每个模块包含:

  1. 理论作业
  2. 编程实践
  3. 案例分析
  4. 小组讨论

About

系统化的AI工程师培养课程,涵盖机器学习、深度学习、大模型开发及工程实践,助力开发者从入门到精通

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published