MusicLM-Universe 是一个系统化讲解 音乐生成大模型(Music Language Model, MusicLM) 的开源教程项目。
随着大语言模型的发展,音乐生成模型正从 MIDI 建模走向端到端纯音频生成,形成 Transformer、Diffusion、Hybrid 等多种技术路线。
本项目重新梳理了 MusicLM 的完整知识体系,我们将音乐视为一种可建模的语言,深入解析:
- 音乐数据表示
- 音频 Tokenizer 原理
- Music Transformer 建模
- 训练与生成流程实现
- 主流开源音乐生成模型(MusicGen / Diffrhythm2 / ACE-Step)部署与源码分析
通过 Notebook 实现,文档讲解和开源模型源码分析,我们希望帮助读者建立音乐大模型如何被构建的完整技术流程。
- 对 AI 音乐生成 感兴趣的开发者
- 具备基本 Python / LLM 基础的 AI 爱好者
第 1 章 Music Representations 音乐数据表示 @田佳铭
第 4 章 音乐生成大模型基础知识 @王泊轩
第 5 章 Transformer 音乐生成模型 - MusicGen @林睿哲
第 6 章 Diffusion 音乐生成模型 - Diffrhythm2 @刘秋杰
第 7 章 Transformer & Diffusion 音乐生成模型 - ACE-Step @田佳铭
- 如果你发现了一些问题,可以提Issue进行反馈,如果提完没有人回复你可以联系保姆团队的同学进行反馈跟进~
- 如果你想参与贡献本项目,可以提Pull request,如果提完没有人回复你可以联系保姆团队的同学进行反馈跟进~
- 如果你对 Datawhale 很感兴趣并想要发起一个新的项目,请按照Datawhale开源项目指南进行操作即可~
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。
注:默认使用CC 4.0协议,也可根据自身项目情况选用其他协议
