✂️ Data Pruning Algorithms for Gaudi Environment

This repository provides an implementation of Difficulty and Uncertainty-Aware Lightweight (DUAL) data pruning, along with other data pruning algorithms particularly suitable for the Gaudi environment.

For more details, check out our paper on arXiv

🚀 Usage

Please refer to each folder for dataset-specific experiments:

exp_cifar for CIFAR (10, 100) experiments
exp_imagenet for ImageNet experiments

📊 Results

DUAL pruning enables efficient dataset pruning without requiring full training on the original dataset while achieving SOTA performance.

Left: Test accuracy comparison on CIFAR-10 dataset under different pruning ratios.
Right: Test accuracy comparison on CIFAR-100 dataset under different pruning ratios.
The color represents the total computation time, including the time spent training the original dataset for score calculation for each pruning method. Blue indicates lower computation time, while red indicates higher computation time. Our method demonstrates its ability to minimize computation time while maintaining SOTA performance.

📌 Available Data Pruning Algorithms

Forgetting https://arxiv.org/abs/1812.05159
EL2N https://arxiv.org/abs/2107.07075
AUM https://arxiv.org/abs/2001.10528
CCS https://arxiv.org/abs/2210.15809
Entropy https://arxiv.org/abs/1906.11829
Dyn-Unc https://arxiv.org/abs/2306.05175
TDDS https://arxiv.org/abs/2311.13613
DUAL (ours) https://arxiv.org/abs/2502.06905

⌛️ Gaudi-v2 Performance Comparison (vs. NVIDIA A6000)

	NVIDIA A6000	intel Gaudi-v2 (Lazy)
CIFAR (Full)	37m 14s	32m 14s
ImageNet (Full)	35h 20m 38s	19h 54m 1s

📚 Citation

@article{cho2025lightweight,
  title={Lightweight Dataset Pruning without Full Training via Example Difficulty and Prediction Uncertainty},
  author={Cho, Yeseul and Shin, Baekrok and Kang, Changmin and Yun, Chulhee},
  journal={arXiv preprint arXiv:2502.06905},
  year={2025}
}

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
exp_cifar		exp_cifar
exp_imagenet		exp_imagenet
.gitignore		.gitignore
README.md		README.md
main_plot.png		main_plot.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

✂️ Data Pruning Algorithms for Gaudi Environment

🚀 Usage

📊 Results

📌 Available Data Pruning Algorithms

⌛️ Gaudi-v2 Performance Comparison (vs. NVIDIA A6000)

📚 Citation

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

NAVER-INTEL-Co-Lab/gaudi-datapruning

Folders and files

Latest commit

History

Repository files navigation

✂️ Data Pruning Algorithms for Gaudi Environment

🚀 Usage

📊 Results

📌 Available Data Pruning Algorithms

⌛️ Gaudi-v2 Performance Comparison (vs. NVIDIA A6000)

📚 Citation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages