Skip to content

datawhalechina/musiclm-universe

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MusicLM-Universe | 音乐生成大模型原理与实践教程

项目简介

MusicLM-Universe 是一个系统化讲解 音乐生成大模型(Music Language Model, MusicLM) 的开源教程项目。

随着大语言模型的发展,音乐生成模型正从 MIDI 建模走向端到端纯音频生成,形成 Transformer、Diffusion、Hybrid 等多种技术路线。

本项目重新梳理了 MusicLM 的完整知识体系,我们将音乐视为一种可建模的语言,深入解析:

  • 音乐数据表示
  • 音频 Tokenizer 原理
  • Music Transformer 建模
  • 训练与生成流程实现
  • 主流开源音乐生成模型(MusicGen / Diffrhythm2 / ACE-Step)部署与源码分析

通过 Notebook 实现,文档讲解和开源模型源码分析,我们希望帮助读者建立音乐大模型如何被构建的完整技术流程。

项目受众

  • 对 AI 音乐生成 感兴趣的开发者
  • 具备基本 Python / LLM 基础的 AI 爱好者

目录

一、MusicLM 完整实现流程 Notebook 部分

第 1 章 Music Representations 音乐数据表示 @田佳铭

第 2 章 Audio Tokenizer @田佳铭

第 3 章 Music Transformer @田佳铭

二、Music 生成基础知识文档部分

第 4 章 音乐生成大模型基础知识 @王泊轩

三、开源音乐生成大模型部署使用及代码分析

第 5 章 Transformer 音乐生成模型 - MusicGen @林睿哲

第 6 章 Diffusion 音乐生成模型 - Diffrhythm2 @刘秋杰

第 7 章 Transformer & Diffusion 音乐生成模型 - ACE-Step @田佳铭

参与贡献

  • 如果你发现了一些问题,可以提Issue进行反馈,如果提完没有人回复你可以联系保姆团队的同学进行反馈跟进~
  • 如果你想参与贡献本项目,可以提Pull request,如果提完没有人回复你可以联系保姆团队的同学进行反馈跟进~
  • 如果你对 Datawhale 很感兴趣并想要发起一个新的项目,请按照Datawhale开源项目指南进行操作即可~

关注我们

扫描下方二维码关注公众号:Datawhale

LICENSE

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

注:默认使用CC 4.0协议,也可根据自身项目情况选用其他协议

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages