Topology Control

MIT SGI 2025 topology control project.

A modular, config-driven ML pipeline for 3D shape classification using PyTorch. Features auto-discovery of mesh files, configurable train/val splitting, and comprehensive artifact management. Please see part 1 and part 2 of our article on the SGI 2025 Blog for details.

Features

Modular Pipeline: Data processing → Model building → Training → Evaluation
Auto-Discovery: Automatically finds and processes mesh files in raw data directory
Config-Driven: Fully configurable via YAML files
Artifact Management: Saves experiment results, model info, and training plots
3D Shape Processing: Converts meshes to point clouds with signed distance fields
Flexible Architecture: Supports configurable models

Setup

Python Environment

This project requires Python 3.10. You can set up the environment using either conda or venv:

Option 1: Conda (Recommended)

conda create --name topologycontrol python=3.10
conda activate topologycontrol

Option 2: Virtual Environment

python3.10 -m venv topologycontrol
source topologycontrol/bin/activate  # On Linux/Mac
# or
topologycontrol\Scripts\activate     # On Windows

Install Dependencies

python -m pip install -r requirements.txt

Required Packages

The requirements.txt includes:

torch - PyTorch for deep learning
numpy - Numerical computing
meshio - Mesh file I/O
polyscope - 3D visualization
matplotlib - Plotting and visualization
pyyaml - YAML configuration parsing
libigl - Geometry processing (if available)

Note: Some packages like triangle may need to be installed separately if geometry processing fails.

Project Structure

topology-control/
├── main.py                 # Main pipeline entry point
├── config/
│   └── config.yaml        # Configuration file
├── data/
│   ├── raw/              # Raw mesh files (.obj)
│   └── processed/        # Processed data (train/val splits)
├── src/
│   ├── CPipelineOrchestrator.py  # Main pipeline controller
│   ├── CDataProcessor.py         # Data processing and mesh handling
│   ├── CArchitectureManager.py   # Model architecture definitions
│   ├── CModelTrainer.py          # Training and validation logic
│   ├── CEvaluator.py            # Model evaluation
│   ├── CGeometryUtils.py        # 3D geometry utilities
│   └── CArtifactManager.py      # Experiment artifact management
└── artifacts/            # Generated experiment artifacts

Usage

Quick Start

Place your mesh files (.obj format) in data/raw/
Configure the pipeline in config/config.yaml
Run the pipeline:

python main.py

Configuration

Edit config/config.yaml to customize:

Data paths: Raw and processed data directories
Model settings: Architecture, input/output dimensions
Training parameters: Learning rate, batch size, epochs
Processing options: Point cloud sampling, train/val split ratio
Pipeline control: Skip specific steps for debugging

Example Configuration

# Basic setup
home: /path/to/topology-control

# Model configuration
model_config:
  skip_building: false
  model_name: mlp
  input_dim: 3000      # 1000 points × 3 coordinates
  hidden_dims: [512, 256, 128]
  output_dim: 1
  max_points: 1000     # Fixed number of points per shape

# Training parameters
trainer_config:
  skip_training: false
  learning_rate: 0.001
  batch_size: 32
  num_epochs: 50
  optimizer: adam
  loss_function: mse

Data Processing

The pipeline automatically:

Discovers all .obj files in data/raw/
Converts meshes to point clouds with signed distance fields
Splits data into train/validation sets
Saves processed data to data/processed/train/ and data/processed/val/

Artifacts

Each experiment generates timestamped artifacts in artifacts/experiment_YYYYMMDD_HHMMSS/:

pipeline_summary.txt - Overall pipeline execution summary
model_architecture.txt - Model structure and parameter counts
training_results.txt - Training metrics and loss curves
error_report.txt - Error details if pipeline fails

Troubleshooting

Common Issues

ModuleNotFoundError: Ensure all dependencies are installed
Tensor size mismatch: Check max_points configuration matches model input_dim
No mesh files found: Verify .obj files are in data/raw/ directory
CUDA errors: Set device explicitly or ensure GPU drivers are updated

Environment Issues

If you encounter package conflicts:

# Clean conda environment
conda remove --name topologycontrol --all
conda create --name topologycontrol python=3.10
conda activate topologycontrol
pip install -r requirements.txt

Data Issues

If processing fails:

Ensure mesh files are valid .obj format
Check file permissions in data directories
Verify sufficient disk space for processed data

Development

Adding New Models

Implement model class in CArchitectureManager.py
Add model configuration to config.yaml
Update get_model() method to handle new architecture

Extending Data Processing

Modify CDataProcessor.py for new data formats
Update CGeometryUtils.py for new geometry operations
Adjust dataset class in CModelTrainer.py if needed

License

MIT License - See LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 126 Commits
artifacts		artifacts
config		config
data		data
deepsdf		deepsdf
scripts		scripts
volume		volume
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
interpolate.py		interpolate.py
main-tc.py		main-tc.py
main.py		main.py
requirements.txt		requirements.txt
tempCodeRunnerFile.py		tempCodeRunnerFile.py
visualize.py		visualize.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Topology Control

Features

Setup

Python Environment

Option 1: Conda (Recommended)

Option 2: Virtual Environment

Install Dependencies

Required Packages

Project Structure

Usage

Quick Start

Configuration

Example Configuration

Data Processing

Artifacts

Troubleshooting

Common Issues

Environment Issues

Data Issues

Development

Adding New Models

Extending Data Processing

License

About

Uh oh!

Releases

Packages

Contributors 6

Uh oh!

Languages

paulkry/topology-control

Folders and files

Latest commit

History

Repository files navigation

Topology Control

Features

Setup

Python Environment

Option 1: Conda (Recommended)

Option 2: Virtual Environment

Install Dependencies

Required Packages

Project Structure

Usage

Quick Start

Configuration

Example Configuration

Data Processing

Artifacts

Troubleshooting

Common Issues

Environment Issues

Data Issues

Development

Adding New Models

Extending Data Processing

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 6

Uh oh!

Languages

Packages