本板块面向 AIGC 算法岗、AI 工程岗、传统深度学习算法岗和开发岗面试,系统梳理计算机数据结构与算法基础,并结合大模型、RAG、Tokenizer、向量数据库、训练数据处理、LLM 推理服务、Agent Workflow、计算图、自动驾驶与视觉后处理等真实 AI 场景进行讲解。
构建原则:
- 先吸收旧版
数据结构基础.md中的常见数据结构、二叉树遍历、排序、二分、堆、链表、单调栈、回溯、拓扑排序、二分图、数值算法和计算几何内容。 - 再参考
研究项目/algo中数组、链表、栈、队列、递归、排序、二分、哈希、跳表、LRU、二叉树、堆、图、字符串、Trie、AC 自动机、动态规划、位图等实现与笔记。 - 最后补充 AIGC 时代高频工程场景,让每个算法问题都能和 AI 业务、训练、推理、检索或系统设计关联起来。
-
建立数据结构、算法复杂度、AI 工程场景之间的整体地图。
-
掌握数组、字符串、Tensor、链表、LRU、栈、队列、单调栈、单调队列和流式推理中的线性结构。
-
系统学习排序、Top K、二分查找、二分答案、哈希表、LRU、跳表,以及它们在 RAG、采样、缓存和调度中的应用。
-
学习树、二叉树遍历、堆、优先队列、图、BFS / DFS、二分图、拓扑排序、最短路、计算图和 Agent Workflow。
-
学习字符串匹配、KMP、BM、Trie、AC 自动机、Bitmap、布隆过滤器、倒排索引、向量索引和计算几何。
-
学习递归、分治、减治、回溯、搜索、动态规划、贪心、双指针、滑动窗口、牛顿迭代、高斯消元和综合 AI 系统优化题。
-
对 01-06 中适合代码化的高频问答补充 Python、C/C++、Java 三语言模板,覆盖链表、LRU、单调结构、排序、二分、Top K、树图、KMP、Trie、几何、回溯、DP 和数值算法。
| 文档 | 核心职责 | 主要 AI 结合点 |
|---|---|---|
01 总览 |
建立知识地图、复杂度意识和工程权衡 | Tensor、KV Cache、RAG、向量索引、Agent graph |
02 线性结构 |
讲清连续内存、链表、缓存、栈队列和流式结构 | token buffer、DataLoader、dynamic batching、LRU |
03 排序查找哈希 |
讲清排序、二分、Top K、哈希和跳表 | logits Top K、Beam Search、RAG rerank、缓存 |
04 树堆图 |
讲清层级、优先级、依赖和关系建模 | 计算图、知识图谱、任务 DAG、Agent Workflow |
05 高级结构 |
讲清字符串、索引、检索和空间几何 | Tokenizer、AC 安全过滤、RAG、向量库、视觉后处理 |
06 算法思想 |
讲清递归、搜索、DP、贪心、窗口和数值算法 | CTC、Viterbi、LLM 推理优化、RAG 系统设计 |
07 三语言代码 |
为适合手写的问题补充 Python、C/C++、Java 模板 | 面试手写代码、笔试、工程实现迁移 |
Top K在03中从排序和选择算法角度讲,在04中只作为堆和优先队列应用出现。二分查找在03中讲模板和边界,在06中只从减治和单调答案角度总结。Trie在05中集中讲,不在04的树章节展开细节。RAG在各章只讲与本章数据结构相关的切面:总览讲系统地图,排序讲重排,字符串讲倒排索引,高级结构讲向量索引,算法思想讲综合优化。Agent Workflow在04中按图和 DAG 讲结构,在06中按搜索和规划讲算法思想。代码模板统一放在07中,避免 01-06 主线文档被大量代码块打散;后续新增算法题也优先补到07。
如果时间有限,建议优先掌握:
- 数组、字符串、Tensor、链表、栈、队列。
- 二分查找、哈希表、排序、Top K、LRU。
- 二叉树遍历、堆、BFS、DFS、拓扑排序。
- Trie、AC 自动机、倒排索引、向量索引。
- 回溯、动态规划、滑动窗口、贪心。
- RAG、LLM 推理、训练数据处理中的算法系统设计。
- 对照
07手写 Python、C/C++、Java 高频模板。