Skip to content

Latest commit

 

History

History
39 lines (26 loc) · 1 KB

File metadata and controls

39 lines (26 loc) · 1 KB

By Family

这个索引适合从模型家族纵向理解技术演进。

Llama

  • 路径: models/llama/
  • 适合学习: 开源基础模型、chat 对齐、训练 recipe 演进
  • 建议先读: Llama 2 -> Llama 3

Qwen

  • 路径: models/qwen/
  • 适合学习: 中文/多语言、通用模型到专用模型扩展、开源产品线组织
  • 建议先读: Qwen1.5 -> Qwen2 -> Qwen2.5

DeepSeek

  • 路径: models/deepseek/
  • 适合学习: MoE、推理增强、数学和代码能力、Reasoning RL
  • 建议先读: DeepSeek-V2 -> DeepSeek-V3 -> DeepSeek-R1

Mistral

  • 路径: models/mistral/
  • 适合学习: 稠密小模型、MoE 商业化路线、推理效率
  • 建议先读: Mistral 7B -> Mixtral 8x7B

Gemma

  • 路径: models/gemma/
  • 适合学习: Google 开源模型路线、多尺寸家族设计
  • 建议先读: Gemma 2 -> Gemma 3

Yi / Chinese Open Models

  • 路径: models/yi/
  • 适合学习: 中文开源模型演进、参数规模和数据策略
  • 建议先读: Yi-34B -> Yi-1.5 -> InternLM2.5