training_inference_from_scratch Stage 0 Stage 0 Roadmap 了解不考虑模型特性的情况下,模型训练和推理的过程中到底发生了什么 Torch的使用和理解 学会用profiler观察timeline以分析cpu/gpu/通信的单活动或overlap情况 overlap是指“相互重叠“ nv GPU的基本特性的理解 集合通信引入 3D并行和实操 huggingface使用