dllm-dev/bash_scripts/run_data_gen_targets.sh at main · kuleshov-group/dllm-dev · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
#!/bin/bash
# Setup environment
cd ../ || exit  # Go to the root directory of the repo
source setup_env.sh

# Example configuration for collecting distillation samples from GSM8K
# Modify these parameters as needed

# Model configuration
MODEL_PATH="Qwen/Qwen3-32B-AWQ"  # Path to model checkpoint or HuggingFace model
# MODEL_PATH="${RUN_DIR}/<PATH_TO_SAVED_MODEL_DIR>"  # Alternative: local checkpoint path
REVISION=null

# Saving configuration
SAVE_INTERVAL=100
BATCH_SIZE=1

# Generation parameters
L=256  # max_new_tokens
DO_SAMPLE=false
MAX_LENGTH=1023

# Dataset configuration
DATASET_CONFIG="gsm8k_train"  # Options: gsm8k_train, gsm8k_eval, wmt_train, etc.

# Output configuration
OUTPUT_DIR="outputs/distillation/${MODEL_PATH##*/}/${DATASET_CONFIG}"
OUTPUT_PATH="${OUTPUT_DIR}/L-${L}-do_sample-${DO_SAMPLE}"
mkdir -p ${OUTPUT_PATH}

PORT=29500

SYSTEM_PROMPT="Please reason step by step, and put your final answer within $\\boxed{}$."

torchrun --nproc_per_node ${NUM_VISIBLE_DEVICES} --master_port=${PORT} scripts/dump_targets.py \
  hydra.output_subdir=null \
  hydra.run.dir="${PWD}" \
  hydra/job_logging=disabled \
  hydra/hydra_logging=disabled \
  dataset=${DATASET_CONFIG} \
  dataset.max_length=${MAX_LENGTH} \
  dataset.use_chat_template=true \
  pretrained_model_name_or_path=${MODEL_PATH} \
  pretrained_model_revision=${REVISION} \
  tokenizer.pretrained_model_name_or_path=${MODEL_PATH} \
  tokenizer.padding_side=left \
  output_path=${OUTPUT_PATH} \
  max_length=${MAX_LENGTH} \
  max_new_tokens=${L} \
  batch_size=${BATCH_SIZE} \
  dataloader.batch_size=${BATCH_SIZE} \
  dataloader.num_workers=0 \
  generation_config.do_sample=${DO_SAMPLE} \
  generation/stopping_criteria@stopping_criteria_list='[eos_token_criteria]' \
  ~generation/logits_processor@logits_processor_list \
  gen_kwargs.logits_processor=null \
  save_interval=${SAVE_INTERVAL}