new: TrainingConfig class; added training configs for each model. #32

joshhan619 · 2025-03-05T06:01:43Z

Instead of using HF's PretrainedConfig and dumping all model parameters and hyperparameters into one place, TrainingConfig clearly separates the model's PretrainedConfig from training parameters like batch size, learning rate, etc.

In addition, this PR adds extensions of PretrainedConfig for each baseline (LTSMConfig, DLinearConfig, PatchTSTConfig, and InformerConfig). This exposes the expected model parameters to users and it provides reasonable defaults as backup.

new: TrainingConfig class; added training configs for each model.

e7d7229

ynchuang merged commit 4cbea68 into datamllab:ltsm-stack Mar 6, 2025
1 check passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

new: TrainingConfig class; added training configs for each model. #32

new: TrainingConfig class; added training configs for each model. #32

Uh oh!

joshhan619 commented Mar 5, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

new: TrainingConfig class; added training configs for each model. #32

new: TrainingConfig class; added training configs for each model. #32

Uh oh!

Conversation

joshhan619 commented Mar 5, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants