Skip to content

XiaomingX/awesome-llm

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Awesome LLM (大型语言模型)

🔥 大型语言模型(LLM)持续引领全球 AI 浪潮,已从通用的对话模型进化为具备深度推理(Reasoning)和自主行动(Agentic)能力的智能体。这里整理了关于大型语言模型,特别是与 ChatGPT、Claude、DeepSeek 及 Llama 系列相关的研究论文,涵盖了 LLM 训练框架、部署工具、课程与教程,以及所有公开的 SOTA 模型检查点和 API。

热门 LLM 项目

  • DeepSeek-R1 - 开源界的推理模型里程碑,通过强化学习激发了类似 OpenAI o1 的深度思考能力。
  • OpenAI o1/o3 - 开启了“系统2”思维时代,通过思维链(CoT)在复杂数学、编程和科学问题上实现了突破性表现。
  • Llama 4 / 3.3 - Meta 继续引领开源,最新的 Llama 4 系列在多模态理解和长上下文处理上设立了新标准。
  • Gemini 3 - Google 的多模态跃进之作,支持百万级 Token 上下文,具备强大的 UI 生成及前端编码能力。
  • Ollama - 目前最流行的本地 LLM 运行工具,支持一键运行 Llama 3.3, Gemma 2, Mistral 等模型。

2026 发展趋势 (Trends)

💡 核心洞察: 大语言模型正从单一语言处理向世界模型 (World Models) 演进,深度融入机器感知、内容生成及因果推理能力。

  • 技术演进: 2026年主流机构(如 DeepSeek, OpenAI, Apple)将密集迭代模型,重点攻克长程推理和 Agentic Workflow。
  • 企业策略: 建议科技企业关注 Llama/Qwen 等开源方案用于内部研发,同时追踪高性价比 API 以优化运营成本。

重要论文里程碑

日期 关键词 机构 论文
2017-06 Transformers Google Attention Is All You Need
2018-06 GPT 1.0 OpenAI Improving Language Understanding by Generative Pre-Training
2018-10 BERT Google BERT: Pre-training of Deep Bidirectional Transformers...
2019-02 GPT 2.0 OpenAI Language Models are Unsupervised Multitask Learners
2020-05 GPT 3.0 OpenAI Language models are few-shot learners
2022-01 COT Google Chain-of-Thought Prompting Elicits Reasoning in LLMs
2022-11 ChatGPT OpenAI Introducing ChatGPT
2023-02 LLaMA Meta LLaMA: Open and Efficient Foundation Language Models
2023-03 GPT-4 OpenAI GPT-4 Technical Report
2023-12 Mamba CMU/Princeton Mamba: Linear-Time Sequence Modeling with Selective State Spaces
2024-01 DeepSeek-MoE DeepSeek DeepSeekMoE: Towards Ultimate Expert Specialization...
2024-05 Mamba2 CMU/Princeton Transformers are SSMs: Generalized Models...
2024-06 Claude 3.5 Anthropic Claude 3.5 Sonnet System Card
2024-07 Llama 3.1 Meta The Llama 3 Herd of Models
2024-09 OpenAI o1 OpenAI Learning to Reason with LLMs (System Card)
2024-09 Qwen 2.5 Alibaba Qwen2.5 Technical Report
2024-12 DeepSeek-V3 DeepSeek DeepSeek-V3 Technical Report
2025-01 DeepSeek-R1 DeepSeek DeepSeek-R1: Incentivizing Reasoning via Reinforcement Learning
2025-05 Claude 4 Anthropic Claude 4 Opus Technical Report
2025-08 GPT-5.2 OpenAI GPT-5 System Card (专业工作优化,强化工具调用)
2025-09 Claude 4.5 Anthropic Claude 4.5 Sonnet Update

其他相关论文

大型语言模型(LLM)排行榜

  • Chatbot Arena (LMSYS) - 排行榜链接 - 业内最权威的盲测排行榜,涵盖 GPT-5, Claude 4.5, Llama 4 等最新模型。
  • OpenCompass 2.0 - OpenCompass - 涵盖代码、数学、推理等维度的全方位评测。
  • LiveBench - LiveBench - 旨在防止“刷榜”的动态基准测试,题目定期更新,更能反映模型真实能力。
  • Open LLM Leaderboard - Hugging Face - 针对开源模型的权威自动化评测。

开源大语言模型 (LLM)

Meta

  • Llama 4 系列 - 最新的多模态开源王者 (Scout, Maverick, Behemoth)。
  • Llama 3.3 / 3.1 - 依然强大的工业级标准模型 (70B, 405B)。

DeepSeek (深度求索)

  • DeepSeek-R1 - 开源推理模型首选,数学与代码能力媲美闭源 SOTA。
  • DeepSeek-V3 - 极具性价比的 MoE 模型,性能对标 GPT-4o。

Alibaba (阿里云)

Mistral AI

Google

  • Gemma 3 / 2 - Google 的轻量级开源模型,适合学术研究和笔记本部署。

其他优秀模型

  • GLM-4-Plus - 智谱AI 最新力作,结合 PPO 技术大幅提升推理与指令遵循能力,商业化落地首选。
  • Phi-4 - Microsoft 推出的“小而美”模型,推理能力惊人。
  • Nemotron-4 - NVIDIA 发布的用于生成合成数据的重型模型。

LLM 评估与数据

LLM训练框架

  • Unsloth - 强烈推荐。训练速度提升 2-5 倍,显存占用减少 50%,是目前微调 Llama/Mistral 的首选工具。
  • Axolotl - 配置化微调工具,支持绝大多数主流开源模型。
  • Llama-Factory - 提供 WebUI 的微调框架,对中文用户非常友好。
  • Firefly - 全能型训练框架,支持预训练、SFT、DPO,适配 Qwen/Llama 等主流模型。
  • DeepSpeed & Megatron-LM - 依然是超大规模集群预训练的基石。
  • ColossalAI - 面向大模型时代的统一并行训练系统,支持异构内存管理,显著降低显存开销。

💡 选型建议: 对于大规模预训练(千卡级),优先选择 DeepSpeedColossalAI 以确保稳定性和效率;对于中小规模微调或快速验证,UnslothLlama-Factory 是最高效的选择。

LLM 加速与内核 (Acceleration & Kernels)

  • FlashInfer - 加速 FlashAttention,支持 2-5x 速度提升,LLM Serving 必备内核库。
  • DeepGEMM - DeepSeek 开源的高效 FP8 GEMM 内核,适用于极致性能优化。
  • DeepEP - 专家并行通信库,大幅提升 MoE 模型分布式训练效率。

多模态预训练 (Multimodal Pre-training)

语音 (Audio)

  • SpeechBrain - PyTorch 语音工具包,支持 wav2vec 2.0/Whisper 等大规模自监督预训练。
  • S3PRL - 专注于自监督学习 (SSL) 的预训练框架,支持 HuBERT/TERA 等 Upstream 模型。

视频 (Video)

  • VideoMAE - (V1/V2) 视频版 MAE,通过高掩码率自监督学习高效视频表示 (Kinetics-400 SOTA)。
  • VPT (Video Pre-Training) - OpenAI 用行为克隆从 Minecraft 视频大规模预训练代理模型。
  • EVL - 冻结 CLIP 骨干的高效视频学习器,极低训练成本实现高精度识别。

LLM 预训练方法 (Pre-training Methods)

  • MiniMind - 从零构建小参数 LLM (26M起) 的全流程教程,适合低成本实验。
  • SO-Large-LM - 系统化的预训练开源教程,覆盖数据清洗、分词到 MoE 架构设计。
  • Happy-LLM - 专注 Transformer 原理实现的预训练实践项目。

多模态嵌入 (Multimodal Embeddings)

  • ImageBind - Meta 开源的六模态统一嵌入空间 (图像/文本/音频/深度/热/IMU)。
  • CLIP & timm - 图像文本对齐的基石模型与最大的视觉骨干库。
  • E5-V - 桥接 Llama3 与视觉模型的通用多模态嵌入。

强化学习与机器人 (RL & Robotics)

强化学习 (Reinforcement Learning)

  • Stable-Baselines3 - 基于 PyTorch 的标准 RL 算法实现 (PPO, TD3, SAC),稳定可靠。
  • RLlib (Ray) - 工业级分布式 RL 训练框架,支持大规模多智能体环境。
  • CleanRL - 单文件实现的 RL 算法库 (PPO/DQN),代码极其简洁,适合入门与魔改。
  • Easy-RL - 经典的强化学习中文教程(蘑菇书),配套完善的代码实践。

具身智能 (Robotics/Embodied AI)

  • MuJoCo - DeepMind 开源的高精度物理引擎,RL 机器人研究的标准环境。
  • OpenManipulator - 基于 ROS 的开源机械臂平台,支持完整的仿真到实物迁移。
  • RoboNet - 大规模机器人交互数据集,用于泛化策略学习。

LLM 部署与推理 (Deployment & Inference)

推理引擎 (Inference Engines)

  • vLLM - 生产环境首选。支持 PagedAttention 和连续批处理,吞吐量 SOTA。
  • llama.cpp - 边缘计算神器。纯 C++ 实现,针对 Apple Silicon 和 CPU 极致优化。
  • TensorRT-LLM - NVIDIA 官方加速库,支持 In-flight batching 和 FP8 量化。
  • LMDeploy - InternLM 团队推出的高性能推理工具,TurboMind 引擎速度极快。
  • LightLLM - 纯 Python/Triton 实现的轻量级推理框架,易于修改和扩展。

推理网关 (Inference Gateways)

  • Inference Gateway - 企业级 AI 网关,统一管理 OpenAI/Ollama/Anthropic 等接口,支持 MCP 协议。
  • LiteLLM - 最流行代理。用统一的 OpenAI 格式调用 100+ 种 LLM API,支持负载均衡和成本追踪。
  • llm-d - Kubernetes 原生的分布式推理栈,集成了 vLLM 和网关。
  • Open WebUI - 功能最强大的本地 Web 界面,自带 RAG 和多模型管理。
  • BentoML - 将模型打包为生产级微服务的统一框架。

模型仓库与数据管理 (Model Registries)

  • KohakuHub - 自托管的 Hugging Face 替代方案,支持 Git-like 版本控制,适合企业内部私有部署。
  • DagsHub - 结合 GitHub + DVC 的开源 ML 平台,提供实验跟踪和数据版本管理。

LLM 编程助手 (AI Coding Assistants)

  • Cursor - 当前体验最佳。基于 VS Code 修改的 AI 原生编辑器,Tab 补全和 Composer 功能极大地改变了编程体验。
  • Windsurf - Codeium 推出的 Agentic IDE,主打深度上下文感知和主动行动能力。
  • Cline - 开源的自主编程 Agent 插件,能够执行终端命令、文件读写,配合 Claude 3.5 Sonnet 效果拔群。
  • Continue - 开源的 IDE 插件 (VS Code / JetBrains),支持连接本地 Ollama 模型进行辅助编程。

LLM应用与智能体 (Agent)

  • LangGraph - LangChain 的升级版,专注于构建有状态、循环的智能体工作流。
  • Dify - 开源的 LLM 应用开发平台,可视化编排 RAG 和 Agent。
  • MemGPT - 赋予 LLM 长期记忆和操作系统级别的上下文管理能力。
  • CrewAI - 编排角色扮演的 AI 智能体团队来共同完成任务。

提示工程与优化 (Prompt Engineering)

  • DSPy - 斯坦福推出的框架,主张“编程”而非“提示”语言模型,通过编译自动优化 Prompt。
  • Promptfoo - 开发者友好的 LLM 测试工具,用于评估 Prompt 质量和模型输出,防止回归。

LLM教程与课程 (2025版)

About

Awesome-LLM: a curated list of Large Language Model.🔥 大型语言模型(LLM)已经席卷了 全球,不再局限于 NLP 或 AI 社区。这里整理了一些关于大型语言模型,特别是与 ChatGPT 相关的研究论文,涵盖了 LLM 训练框架、部署工具、课程与教程,以及所有公开的 LLM 检查点和 API。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages