39 lines (26 loc) · 1 KB

By Family

这个索引适合从模型家族纵向理解技术演进。

Llama

路径: models/llama/
适合学习: 开源基础模型、chat 对齐、训练 recipe 演进
建议先读: Llama 2 -> Llama 3

Qwen

路径: models/qwen/
适合学习: 中文/多语言、通用模型到专用模型扩展、开源产品线组织
建议先读: Qwen1.5 -> Qwen2 -> Qwen2.5

DeepSeek

路径: models/deepseek/
适合学习: MoE、推理增强、数学和代码能力、Reasoning RL
建议先读: DeepSeek-V2 -> DeepSeek-V3 -> DeepSeek-R1

Mistral

路径: models/mistral/
适合学习: 稠密小模型、MoE 商业化路线、推理效率
建议先读: Mistral 7B -> Mixtral 8x7B

Gemma

路径: models/gemma/
适合学习: Google 开源模型路线、多尺寸家族设计
建议先读: Gemma 2 -> Gemma 3

Yi / Chinese Open Models

路径: models/yi/
适合学习: 中文开源模型演进、参数规模和数据策略
建议先读: Yi-34B -> Yi-1.5 -> InternLM2.5