Fix cache folder in SLM deployment

oglok · oglok · commit 9d4af4f520e8 · 2026-02-27T14:37:18.000+01:00
Signed-off-by: Ricardo Noriega De Soto &lt;rnoriega@redhat.com&gt;
diff --git a/manifests/vllm-slm/base/deployment.yaml b/manifests/vllm-slm/base/deployment.yaml
@@ -27,11 +27,16 @@ spec:
         - "Qwen/Qwen2.5-1.5B-Instruct"
         - "--max-model-len"
         - "4096"
+        - "--gpu-memory-utilization"
+        - "0.5"
+        - "--enforce-eager"
         ports:
         - name: api
           containerPort: 8000
           protocol: TCP
         env:
+        - name: HOME
+          value: "/tmp"
         - name: HF_HOME
           value: "/tmp/hf-cache"
         - name: HUGGINGFACE_HUB_CACHE