Towards training digitally tied analog blocks via hybrid gradient computation

We release in this repo the codebase which was used to produce the experimental results of "Towards training digitally-tied analog blocks via hybrid gradient computation" (Nest & Ernoult, 2024).

Pre-requisites

This codebase requires:

Python >= 3.10
Pytorch (select here depending on your preferences). The version of the Pytorch packages we used are the following ones:
```
torch==2.0.1
torchaudio==2.0.2
torchmetrics==1.3.2
torchvision==0.15.2
```
Hydra for terminal prompt and configuration files parsing (see here for installation details).
gdown and wget to download the ImageNet32 (ImageNet 1k dataset already downsampled to 32x32 pixels):
```
pip install gdown
pip install wget
```
Optionally: Tensorboard or wandb to track training experiments.

Structure of the codebase

The codebase manipulates three independent types:

Algorithm: either backpropagation through time (BPTT) -- which boils down to Implicit Differentiation (ID) in the context of equilibrium models -- or equilibrium propagation (EP).
HopfieldChain: models are of type HopfieldChain, which themselves read as compositions of HopfieldBlock objects. There are two subtypes of HopfieldChain: VGG and ResNet types. VGG and ResNet are chains of ConvPool and BasicBlock objects, which are themselves subtypes of HopfieldBlock.
Experiment: there are training (TrainingExperiment) and static gradient analysis (GDDExperiment) experiments.

Reproducing Experiments

The codebase utilizes hydra to modularize experiments. The following commands can be used to reproduce results reported in the paper:

Static gradient analysis experiments

This pertains to Figures 3 and 4 of the initial ArXiV release of our paper and Figures 3 and 5 of the camera-ready version (soon to be released).

To reproduce these figures, hit the following command:

python main.py --config-name=gdd

Splitting experiments with a convergence criterion (TOL)

This is Table 1 of the camera-ready version (soon to be released). This table was not included in the initial ArXiV release of our paper.

L	bs	Algorithm	Command
6	6	EP	`python main.py --config-name=splitting_small_TOL model=splitting_small_1block`
6	6	ID	`python main.py --config-name=splitting_small_TOL model=splitting_small_1block algorithm=bptt`
6	3	EP	`python main.py --config-name=splitting_small_TOL model=splitting_small_2block`
6	3	ID	`python main.py --config-name=splitting_small_TOL model=splitting_small_2block algorithm=bptt`
6	2	EP	`python main.py --config-name=splitting_small_TOL model=splitting_small_3block`
6	2	ID	`python main.py --config-name=splitting_small_TOL model=splitting_small_3block algorithm=bptt`
12	4	EP	`python main.py --config-name=splitting_large_TOL model=splitting_large_3block`
12	4	ID	`python main.py --config-name=splitting_large_TOL model=splitting_large_3block algorithm=bptt`
12	3	EP	`python main.py --config-name=splitting_large_TOL model=splitting_large_4block`
12	3	ID	`python main.py --config-name=splitting_large_TOL model=splitting_large_4block algorithm=bptt`
12	2	EP	`python main.py --config-name=splitting_large_TOL model=splitting_large_6block`
12	2	ID	`python main.py --config-name=splitting_large_TOL model=splitting_large_6block algorithm=bptt`

Splitting experiments with a fixed number of iterations

This is Table 1 of the initial ArXiV release of our paper and Table 7 of the camera-ready version (soon to be released).

L	bs	Algorithm	Command
6	6	EP	`python main.py --config-name=splitting_small model=splitting_small_1block`
6	6	ID	`python main.py --config-name=splitting_small model=splitting_small_1block algorithm=bptt`
6	3	EP	`python main.py --config-name=splitting_small model=splitting_small_2block`
6	3	ID	`python main.py --config-name=splitting_small model=splitting_small_2block algorithm=bptt`
6	2	EP	`python main.py --config-name=splitting_small model=splitting_small_3block`
6	2	ID	`python main.py --config-name=splitting_small model=splitting_small_3block algorithm=bptt`
12	4	EP	`python main.py --config-name=splitting_large model=splitting_large_3block`
12	4	ID	`python main.py --config-name=splitting_large model=splitting_large_3block algorithm=bptt`
12	3	EP	`python main.py --config-name=splitting_large model=splitting_large_4block`
12	3	ID	`python main.py --config-name=splitting_large model=splitting_large_4block algorithm=bptt`
12	2	EP	`python main.py --config-name=splitting_large model=splitting_large_6block`
12	2	ID	`python main.py --config-name=splitting_large model=splitting_large_6block algorithm=bptt`

Scaling experiments (Table 2)

L	Dataset	Algorithm	Command
12	CIFAR100	EP	`python main.py --config-name=scaling_small model=scaling_small data=cifar100`
12	CIFAR100	ID	`python main.py --config-name=scaling_small model=scaling_small data=cifar100 algorithm=bptt`
12	ImageNet32	EP	`python main.py --config-name=scaling_small model=scaling_small data=imagenet32`
12	ImageNet32	ID	`python main.py --config-name=scaling_small model=scaling_small data=imagenet32 algorithm=bptt`
15	CIFAR100	EP	`python main.py --config-name=scaling_large model=scaling_large data=cifar100`
15	CIFAR100	ID	`python main.py --config-name=scaling_large model=scaling_large data=cifar100 algorithm=bptt`
15	ImageNet32	EP	`python main.py --config-name=scaling_large model=scaling_large data=imagenet32`
15	ImageNet32	ID	`python main.py --config-name=scaling_large model=scaling_large data=imagenet32 algorithm=bptt`

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
hydra_conf		hydra_conf
images		images
src		src
.DS_Store		.DS_Store
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Towards training digitally tied analog blocks via hybrid gradient computation

Pre-requisites

Structure of the codebase

Reproducing Experiments

Static gradient analysis experiments

Splitting experiments with a convergence criterion (TOL)

Splitting experiments with a fixed number of iterations

Scaling experiments (Table 2)

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

License

timothynest/hybrid_bp_ep_official

Folders and files

Latest commit

History

Repository files navigation

Towards training digitally tied analog blocks via hybrid gradient computation

Pre-requisites

Structure of the codebase

Reproducing Experiments

Static gradient analysis experiments

Splitting experiments with a convergence criterion (TOL)

Splitting experiments with a fixed number of iterations

Scaling experiments (Table 2)

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages