Awesome LLM (大型语言模型)

🔥 大型语言模型（LLM）持续引领全球 AI 浪潮，已从通用的对话模型进化为具备深度推理（Reasoning）和自主行动（Agentic）能力的智能体。这里整理了关于大型语言模型，特别是与 ChatGPT、Claude、DeepSeek 及 Llama 系列相关的研究论文，涵盖了 LLM 训练框架、部署工具、课程与教程，以及所有公开的 SOTA 模型检查点和 API。

2026 发展趋势 (Trends)

💡 核心洞察: 大语言模型正从单一语言处理向世界模型 (World Models) 演进，深度融入机器感知、内容生成及因果推理能力。

技术演进: 2026年主流机构（如 DeepSeek, OpenAI, Apple）将密集迭代模型，重点攻克长程推理和 Agentic Workflow。
企业策略: 建议科技企业关注 Llama/Qwen 等开源方案用于内部研发，同时追踪高性价比 API 以优化运营成本。

重要论文里程碑

日期	关键词	机构	论文
2017-06	Transformers	Google	Attention Is All You Need
2018-06	GPT 1.0	OpenAI	Improving Language Understanding by Generative Pre-Training
2018-10	BERT	Google	BERT: Pre-training of Deep Bidirectional Transformers...
2019-02	GPT 2.0	OpenAI	Language Models are Unsupervised Multitask Learners
2020-05	GPT 3.0	OpenAI	Language models are few-shot learners
2022-01	COT	Google	Chain-of-Thought Prompting Elicits Reasoning in LLMs
2022-11	ChatGPT	OpenAI	Introducing ChatGPT
2023-02	LLaMA	Meta	LLaMA: Open and Efficient Foundation Language Models
2023-03	GPT-4	OpenAI	GPT-4 Technical Report
2023-12	Mamba	CMU/Princeton	Mamba: Linear-Time Sequence Modeling with Selective State Spaces
2024-01	DeepSeek-MoE	DeepSeek	DeepSeekMoE: Towards Ultimate Expert Specialization...
2024-05	Mamba2	CMU/Princeton	Transformers are SSMs: Generalized Models...
2024-06	Claude 3.5	Anthropic	Claude 3.5 Sonnet System Card
2024-07	Llama 3.1	Meta	The Llama 3 Herd of Models
2024-09	OpenAI o1	OpenAI	Learning to Reason with LLMs (System Card)
2024-09	Qwen 2.5	Alibaba	Qwen2.5 Technical Report
2024-12	DeepSeek-V3	DeepSeek	DeepSeek-V3 Technical Report
2025-01	DeepSeek-R1	DeepSeek	DeepSeek-R1: Incentivizing Reasoning via Reinforcement Learning
2025-05	Claude 4	Anthropic	Claude 4 Opus Technical Report
2025-08	GPT-5.2	OpenAI	GPT-5 System Card (专业工作优化，强化工具调用)
2025-09	Claude 4.5	Anthropic	Claude 4.5 Sonnet Update

其他相关论文

LLM推理与思维链 (Reasoning & CoT) - 关注 OpenAI o1 和 DeepSeek-R1 引发的推理能力研究。
高效微调与量化 - Unsloth, QLoRA 等让个人显卡也能微调大模型的技术。
Agentic Workflow (智能体工作流) - 从单一 Prompt 到复杂的智能体协作系统。

大型语言模型（LLM）排行榜

Chatbot Arena (LMSYS) - 排行榜链接 - 业内最权威的盲测排行榜，涵盖 GPT-5, Claude 4.5, Llama 4 等最新模型。
OpenCompass 2.0 - OpenCompass - 涵盖代码、数学、推理等维度的全方位评测。
LiveBench - LiveBench - 旨在防止“刷榜”的动态基准测试，题目定期更新，更能反映模型真实能力。
Open LLM Leaderboard - Hugging Face - 针对开源模型的权威自动化评测。

开源大语言模型 (LLM)

DeepSeek (深度求索)

DeepSeek-R1 - 开源推理模型首选，数学与代码能力媲美闭源 SOTA。
DeepSeek-V3 - 极具性价比的 MoE 模型，性能对标 GPT-4o。

Alibaba (阿里云)

Qwen 3 (通义千问) - Qwen 3 系列在编码和数学领域持续霸榜。
Qwen 2.5 - 覆盖 0.5B 到 72B 的全尺寸高性能模型。

Mistral AI

Mistral Large 2 - 欧洲最强开源模型，上下文窗口大，指令遵循能力强。
Mistral Nemo / Small - 针对端侧和低延迟场景优化。

Google

Gemma 3 / 2 - Google 的轻量级开源模型，适合学术研究和笔记本部署。

其他优秀模型

GLM-4-Plus - 智谱AI 最新力作，结合 PPO 技术大幅提升推理与指令遵循能力，商业化落地首选。
Phi-4 - Microsoft 推出的“小而美”模型，推理能力惊人。
Nemotron-4 - NVIDIA 发布的用于生成合成数据的重型模型。

LLM 评估与数据

LiveBench - 防止数据泄露的动态评测。
Scale AI Leaderboard - 专注于代码生成和指令遵循的评测。

LLM训练框架

Unsloth - 强烈推荐。训练速度提升 2-5 倍，显存占用减少 50%，是目前微调 Llama/Mistral 的首选工具。
Axolotl - 配置化微调工具，支持绝大多数主流开源模型。
Llama-Factory - 提供 WebUI 的微调框架，对中文用户非常友好。
Firefly - 全能型训练框架，支持预训练、SFT、DPO，适配 Qwen/Llama 等主流模型。
DeepSpeed & Megatron-LM - 依然是超大规模集群预训练的基石。
ColossalAI - 面向大模型时代的统一并行训练系统，支持异构内存管理，显著降低显存开销。

💡 选型建议: 对于大规模预训练（千卡级），优先选择 DeepSpeed 或 ColossalAI 以确保稳定性和效率；对于中小规模微调或快速验证，Unsloth 和 Llama-Factory 是最高效的选择。

LLM 加速与内核 (Acceleration & Kernels)

FlashInfer - 加速 FlashAttention，支持 2-5x 速度提升，LLM Serving 必备内核库。
DeepGEMM - DeepSeek 开源的高效 FP8 GEMM 内核，适用于极致性能优化。
DeepEP - 专家并行通信库，大幅提升 MoE 模型分布式训练效率。

多模态预训练 (Multimodal Pre-training)

语音 (Audio)

SpeechBrain - PyTorch 语音工具包，支持 wav2vec 2.0/Whisper 等大规模自监督预训练。
S3PRL - 专注于自监督学习 (SSL) 的预训练框架，支持 HuBERT/TERA 等 Upstream 模型。

视频 (Video)

VideoMAE - (V1/V2) 视频版 MAE，通过高掩码率自监督学习高效视频表示 (Kinetics-400 SOTA)。
VPT (Video Pre-Training) - OpenAI 用行为克隆从 Minecraft 视频大规模预训练代理模型。
EVL - 冻结 CLIP 骨干的高效视频学习器，极低训练成本实现高精度识别。

LLM 预训练方法 (Pre-training Methods)

MiniMind - 从零构建小参数 LLM (26M起) 的全流程教程，适合低成本实验。
SO-Large-LM - 系统化的预训练开源教程，覆盖数据清洗、分词到 MoE 架构设计。
Happy-LLM - 专注 Transformer 原理实现的预训练实践项目。

多模态嵌入 (Multimodal Embeddings)

ImageBind - Meta 开源的六模态统一嵌入空间 (图像/文本/音频/深度/热/IMU)。
CLIP & timm - 图像文本对齐的基石模型与最大的视觉骨干库。
E5-V - 桥接 Llama3 与视觉模型的通用多模态嵌入。

强化学习与机器人 (RL & Robotics)

强化学习 (Reinforcement Learning)

Stable-Baselines3 - 基于 PyTorch 的标准 RL 算法实现 (PPO, TD3, SAC)，稳定可靠。
RLlib (Ray) - 工业级分布式 RL 训练框架，支持大规模多智能体环境。
CleanRL - 单文件实现的 RL 算法库 (PPO/DQN)，代码极其简洁，适合入门与魔改。
Easy-RL - 经典的强化学习中文教程（蘑菇书），配套完善的代码实践。

具身智能 (Robotics/Embodied AI)

MuJoCo - DeepMind 开源的高精度物理引擎，RL 机器人研究的标准环境。
OpenManipulator - 基于 ROS 的开源机械臂平台，支持完整的仿真到实物迁移。
RoboNet - 大规模机器人交互数据集，用于泛化策略学习。

LLM 部署与推理 (Deployment & Inference)

推理引擎 (Inference Engines)

vLLM - 生产环境首选。支持 PagedAttention 和连续批处理，吞吐量 SOTA。
llama.cpp - 边缘计算神器。纯 C++ 实现，针对 Apple Silicon 和 CPU 极致优化。
TensorRT-LLM - NVIDIA 官方加速库，支持 In-flight batching 和 FP8 量化。
LMDeploy - InternLM 团队推出的高性能推理工具，TurboMind 引擎速度极快。
LightLLM - 纯 Python/Triton 实现的轻量级推理框架，易于修改和扩展。

推理网关 (Inference Gateways)

Inference Gateway - 企业级 AI 网关，统一管理 OpenAI/Ollama/Anthropic 等接口，支持 MCP 协议。
LiteLLM - 最流行代理。用统一的 OpenAI 格式调用 100+ 种 LLM API，支持负载均衡和成本追踪。
llm-d - Kubernetes 原生的分布式推理栈，集成了 vLLM 和网关。
Open WebUI - 功能最强大的本地 Web 界面，自带 RAG 和多模型管理。
BentoML - 将模型打包为生产级微服务的统一框架。

模型仓库与数据管理 (Model Registries)

KohakuHub - 自托管的 Hugging Face 替代方案，支持 Git-like 版本控制，适合企业内部私有部署。
DagsHub - 结合 GitHub + DVC 的开源 ML 平台，提供实验跟踪和数据版本管理。

LLM 编程助手 (AI Coding Assistants)

Cursor - 当前体验最佳。基于 VS Code 修改的 AI 原生编辑器，Tab 补全和 Composer 功能极大地改变了编程体验。
Windsurf - Codeium 推出的 Agentic IDE，主打深度上下文感知和主动行动能力。
Cline - 开源的自主编程 Agent 插件，能够执行终端命令、文件读写，配合 Claude 3.5 Sonnet 效果拔群。
Continue - 开源的 IDE 插件 (VS Code / JetBrains)，支持连接本地 Ollama 模型进行辅助编程。

LLM应用与智能体 (Agent)

LangGraph - LangChain 的升级版，专注于构建有状态、循环的智能体工作流。
Dify - 开源的 LLM 应用开发平台，可视化编排 RAG 和 Agent。
MemGPT - 赋予 LLM 长期记忆和操作系统级别的上下文管理能力。
CrewAI - 编排角色扮演的 AI 智能体团队来共同完成任务。

提示工程与优化 (Prompt Engineering)

DSPy - 斯坦福推出的框架，主张“编程”而非“提示”语言模型，通过编译自动优化 Prompt。
Promptfoo - 开发者友好的 LLM 测试工具，用于评估 Prompt 质量和模型输出，防止回归。

LLM教程与课程 (2025版)

Andrej Karpathy's LLM101n - Karpathy 大神的最新课程，教你从零构建一个 Storyteller AI。
Generative AI with LLMs (Coursera) - AWS 和 DeepLearning.AI 联合推出的实战课程。
DeepLearning.AI Short Courses - 包含 RAG、Agent、Fine-tuning 等大量免费短课程。

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
docs		docs
src		src
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
LICENSE		LICENSE
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

Awesome LLM (大型语言模型)

热门 LLM 项目

2026 发展趋势 (Trends)

重要论文里程碑

其他相关论文

大型语言模型（LLM）排行榜

开源大语言模型 (LLM)

Meta

DeepSeek (深度求索)

Alibaba (阿里云)

Mistral AI

Google

其他优秀模型

LLM 评估与数据

LLM训练框架

LLM 加速与内核 (Acceleration & Kernels)

多模态预训练 (Multimodal Pre-training)

语音 (Audio)

视频 (Video)

LLM 预训练方法 (Pre-training Methods)

多模态嵌入 (Multimodal Embeddings)

强化学习与机器人 (RL & Robotics)

强化学习 (Reinforcement Learning)

具身智能 (Robotics/Embodied AI)

LLM 部署与推理 (Deployment & Inference)

推理引擎 (Inference Engines)

推理网关 (Inference Gateways)

模型仓库与数据管理 (Model Registries)

LLM 编程助手 (AI Coding Assistants)

LLM应用与智能体 (Agent)

提示工程与优化 (Prompt Engineering)

LLM教程与课程 (2025版)

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages