Skip to content

Latest commit

 

History

History
13 lines (8 loc) · 589 Bytes

README.md

File metadata and controls

13 lines (8 loc) · 589 Bytes

第四章:从零实现 GPT 模型以生成文本

 

章节主要代码

 

额外材料

  • 02_performance-analysis 包含了可选代码,用于分析章节中实现的 GPT 模型的性能。

  • ch05/07_gpt_to_llama 包含了将 GPT 架构实现转换为 Llama 3.2 的逐步指南,并从 Meta AI 加载预训练权重(完成第四章后可以查看不同的架构,但你也可以把它留到第五章后再看)。