marin-community
diff --git a/‎experiments/evals/engine_configs.py‎
Lines changed: 11 additions & 3 deletions b/‎experiments/evals/engine_configs.py‎
Lines changed: 11 additions & 3 deletions
@@ -1,8 +1,16 @@
 # Copyright The Marin Authors
 # SPDX-License-Identifier: Apache-2.0
 
-"""Engine configuration for vLLM used for evals."""
+"""Engine + run defaults for vLLM-backed evals.
 
-DEFAULT_VLLM_ENGINE_KWARGS = {"max_model_len": 4096}
+Splits today's single `DEFAULT_LM_EVAL_MODEL_KWARGS` bag into two halves that
+target the post-#4827 types:
 
-DEFAULT_LM_EVAL_MODEL_KWARGS = {**DEFAULT_VLLM_ENGINE_KWARGS, "max_gen_toks": 4096}
+- `DEFAULT_VLLM_DEPLOYMENT_KWARGS`: vLLM server flags. Feeds `ModelDeployment.engine_kwargs`.
+- `DEFAULT_LM_EVAL_EXTRA_MODEL_ARGS`: per-request / lm-eval client knobs.
+  Feeds `LmEvalRun.extra_model_args` as pre-formatted `k=v` strings.
+"""
+
+DEFAULT_VLLM_DEPLOYMENT_KWARGS: dict = {"max_model_len": 4096}
+
+DEFAULT_LM_EVAL_EXTRA_MODEL_ARGS: tuple[str, ...] = ("max_gen_toks=4096",)