这个索引适合从模型家族纵向理解技术演进。
- 路径:
models/llama/ - 适合学习: 开源基础模型、chat 对齐、训练 recipe 演进
- 建议先读: Llama 2 -> Llama 3
- 路径:
models/qwen/ - 适合学习: 中文/多语言、通用模型到专用模型扩展、开源产品线组织
- 建议先读: Qwen1.5 -> Qwen2 -> Qwen2.5
- 路径:
models/deepseek/ - 适合学习: MoE、推理增强、数学和代码能力、Reasoning RL
- 建议先读: DeepSeek-V2 -> DeepSeek-V3 -> DeepSeek-R1
- 路径:
models/mistral/ - 适合学习: 稠密小模型、MoE 商业化路线、推理效率
- 建议先读: Mistral 7B -> Mixtral 8x7B
- 路径:
models/gemma/ - 适合学习: Google 开源模型路线、多尺寸家族设计
- 建议先读: Gemma 2 -> Gemma 3
- 路径:
models/yi/ - 适合学习: 中文开源模型演进、参数规模和数据策略
- 建议先读: Yi-34B -> Yi-1.5 -> InternLM2.5