GRPO Optuna

Experimental GRPO fine-tuning experiments driven by Optuna hyperparameter search.

Setup

uv venv .venv
uv sync

Tests

uv run -m pytest

CPU sanity check

Run a tiny-model sweep to verify the pipeline without GPUs:

uv run python main.py \
  --model-name hf-internal-testing/tiny-random-gpt2 \
  --output-dir outputs/tiny \
  --run-name tiny \
  --fast-dev-run \
  --report-to none \
  --trials 1 \
  --no-initial

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
src/grpo_optuna		src/grpo_optuna
tests		tests
.gitignore		.gitignore
README.md		README.md
main.py		main.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GRPO Optuna

Setup

Tests

CPU sanity check

About

Uh oh!

Releases

Packages

Uh oh!

Languages

s-smits/grpo-optuna

Folders and files

Latest commit

History

Repository files navigation

GRPO Optuna

Setup

Tests

CPU sanity check

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages