AI Harmonizer

This is the implementation of our paper AI Harmonizer: Expanding Vocal Expression with a Generative Neurosymbolic Music AI System. It is based on the amazing project RVC-Project/Retrieval-based-Voice-Conversion-WebUI.

Caution

This repository uses by default an Anticipatory Music Transformer (AMT) finetuned on the JSB Chorales dataset, which is accessible here: https://huggingface.co/mitmedialab/jsbChorales-1000. As such, it is heavily biased towards baroque music. If you would like to explore other genres, we invite you to finetune AMT on another four-part harmony dataset.

How to Use

Make sure that you clone this repository along with its submodules:

git clone --recurse-submodules https://github.com/mitmedialab/ai-harmonizer-nime2025.git

Install voice models following the instructions of the RVC project.
Run the run.sh script.

./run.sh

In the Gradio interface that opens up, select your voice model, load an audio file, and click "Convert!"

Dependencies

This project is made possible thanks to:

Citation

@article{nime2025_84,
  title = {AI Harmonizer: Expanding Vocal Expression with a Generative Neurosymbolic Music AI System},
  author = {Lancelot Blanchard and Cameron Holt and Joseph Paradiso},
  booktitle = {Proceedings of the International Conference on New Interfaces for Musical Expression},
  address = {Canberra, Australia},
  articleno = {84},
  doi = {10.5281/zenodo.15698966},
  editor = {Doga Cavdir and Florent Berthaut},
  issn = {2220-4806},
  month = {June},
  numpages = {4},
  pages = {578--581},
  track = {Paper},
  url = {http://nime.org/proceedings/2025/nime2025_84.pdf},
  year = {2025}
}

Name		Name	Last commit message	Last commit date
Latest commit History 802 Commits
.github		.github
assets		assets
choraleModel		choraleModel
configs		configs
docs		docs
i18n		i18n
infer		infer
logs/mute		logs/mute
tools		tools
.env		.env
.gitignore		.gitignore
.gitmodules		.gitmodules
CONTRIBUTING.md		CONTRIBUTING.md
Dockerfile		Dockerfile
LICENSE		LICENSE
MIT协议暨相关引用库协议		MIT协议暨相关引用库协议
README.md		README.md
Retrieval_based_Voice_Conversion_WebUI.ipynb		Retrieval_based_Voice_Conversion_WebUI.ipynb
Retrieval_based_Voice_Conversion_WebUI_v2.ipynb		Retrieval_based_Voice_Conversion_WebUI_v2.ipynb
docker-compose.yml		docker-compose.yml
environment_dml.yaml		environment_dml.yaml
go-realtime-gui-dml.bat		go-realtime-gui-dml.bat
go-realtime-gui.bat		go-realtime-gui.bat
go-web-dml.bat		go-web-dml.bat
go-web.bat		go-web.bat
gui_v1.py		gui_v1.py
infer-web.py		infer-web.py
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
requirements-amd.txt		requirements-amd.txt
requirements-dml.txt		requirements-dml.txt
requirements-ipex.txt		requirements-ipex.txt
requirements-win-for-realtime_vc_gui-dml.txt		requirements-win-for-realtime_vc_gui-dml.txt
requirements-win-for-realtime_vc_gui.txt		requirements-win-for-realtime_vc_gui.txt
requirements.txt		requirements.txt
run.sh		run.sh
venv.sh		venv.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

AI Harmonizer

How to Use

Dependencies

Citation

About

Uh oh!

Releases

Packages

Languages

License

mitmedialab/ai-harmonizer-nime2025

Folders and files

Latest commit

History

Repository files navigation

AI Harmonizer

How to Use

Dependencies

Citation

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages