Skip to content

datawhalechina/easy-vectordb

Repository files navigation

alt text

Easy-vectorDB

GitHub stars GitHub forks GitHub issues GitHub license

中文 | English

📚 在线阅读地址

📚 从零开始的向量数据库原理与实践教程

🧭 项目简介

EasyVectorDB 是一个面向开发者与研究者的 向量数据库系统性学习项目
项目内容覆盖从基础概念、算法原理到生产级应用部署的全流程,聚焦以下三个方向:

  • 🧩 理论入门:理解向量数据库的原理、架构与索引机制
  • ⚙️ 实战教程:掌握 Milvus / Faiss / Annoy 的使用与优化技巧
  • 💡 项目案例:从零构建 RAG、嵌入检索、聚类可视化等完整项目

📖 内容导航

项目共分为 基础学习篇实践篇 两个部分,对应导航栏配置如下:

章节 关键内容 状态
第一部分:基础学习篇(Base) 向量数据库原理、嵌入与搜索基础
Chapter 1 项目介绍 项目目标、整体学习路径
Chapter 2 为什么需要向量数据库 检索瓶颈、相似度搜索原理
Chapter 3 向量嵌入算法基础 Word2Vec、Transformer Embedding
Chapter 4 向量搜索算法基础 暴力检索、向量相似度
Chapter 5 ANN 搜索算法 IVF、PQ、HNSW、LSH 原理与代码实战
Chapter 6 实现你自己的向量数据库 向量数据库最小实现
第二部分:Faiss 教程(Faiss) 高性能向量检索引擎实战
Chapter 1 FAISS 入门与环境搭建 安装配置、基础概念
Chapter 2 FAISS 核心索引实战 Flat、IVF、PQ、HNSW 等索引
Chapter 3 FAISS 核心功能进阶 复合索引、GPU、批量检索
Chapter 4 FAISS 性能调优与评估 Recall、延迟、内存调优
Chapter 5 FAISS 工程化落地实战 工程结构、服务化、实战案例
第三部分:Milvus 教程(Milvus) 分布式向量数据库与工程实践
Chapter 1 Milvus 向量数据库入门:认知与架构 架构设计、核心组件
Chapter 2 Milvus 核心概念:数据模型与索引体系 Collection、Partition、Index
Chapter 3 Milvus 基础操作:PyMilvus 核心 API 实战 数据写入、查询、索引管理 🚧
Chapter 4 综合实战:基于 Milvus 的 AI 应用开发 RAG、向量检索应用 🚧
Chapter 5 Milvus 生态与进阶学习 分布式部署、性能优化 🚧
补充内容 与向量数据库有关的内容
MinerU部署教程 pdf/扫描件 转markdown 格式

持续更新中...

📘 本项目旨在让你从 原理 → 实践 → 部署 全流程掌握向量数据库核心知识与实战能力。


📄 补充资源

【相关竞赛】

🤝 参与贡献

  • 如果你发现了一些问题,可以提Issue进行反馈,如果提完没有人回复你可以联系保姆团队的同学进行反馈跟进~
  • 如果你想参与贡献本项目,可以提Pull request,如果提完没有人回复你可以联系保姆团队的同学进行反馈跟进~
  • 如果你对 Datawhale 很感兴趣并想要发起一个新的项目,请按照Datawhale开源项目指南进行操作即可~

核心贡献者

特别感谢

  • 感谢 @Sm1les 对本项目的帮助与支持
  • 感谢所有为本项目做出贡献的开发者们 ❤️

关注我们

扫描下方二维码关注公众号:Datawhale

📊 Star History

Star History Chart

📜 开源协议

知识共享许可协议

本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。

Made with ❤️ by Datawhale

About

📚 从零开始的向量数据库原理与实践教程,在线阅读地址:https://datawhalechina.github.io/easy-vectordb/

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 5