Merge pull request #169 from NillionNetwork/chore/update_vllm_0_11

jcabrero · web-flow · commit a6457487396a · 2025-11-25T09:27:32.000+01:00
feat: update vLLM version 0.11.2
diff --git a/docker/vllm.Dockerfile b/docker/vllm.Dockerfile
@@ -1,4 +1,4 @@
-FROM vllm/vllm-openai:v0.10.1
+FROM vllm/vllm-openai:v0.11.2
 
 # # Specify model name and path during build
 # ARG MODEL_NAME=llama_1b_cpu
@@ -9,6 +9,7 @@ FROM vllm/vllm-openai:v0.10.1
 # ENV MODEL_PATH=${MODEL_PATH}
 # ENV EXEC_PATH=nilai_models.models.${MODEL_NAME}:app
 
+ENV PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True
 COPY --link . /daemon/
 COPY --link vllm_templates /opt/vllm/templates