new targets for nightly (#977)

mamy-CS · web-flow · commit 96c7e55025a7 · 2026-04-03T13:39:43.000-04:00
Signed-off-by: Mohammed Abdi &lt;mohammed.munir.abdi@ibm.com&gt;
diff --git a/Makefile b/Makefile
@@ -257,13 +257,6 @@ test-e2e-full: ## Run full e2e test suite
 	echo "=========================================="; \
 	exit $$TEST_EXIT_CODE
 
-# Stub for llm-d nightly reusable workflows (test_target=test-llm-d-nightly)
-# No-op; temporarily satisfies nightly CI make invocation
-# TODO: add nightly guide tests here
-.PHONY: test-llm-d-nightly
-test-llm-d-nightly:
-	@:
-
 # Convenience targets for local e2e testing
 
 # Convenience target that deploys infra + runs smoke tests.
@@ -301,6 +294,24 @@ test-benchmark: manifests generate fmt vet ## Run benchmark tests (scale-up-late
 .PHONY: test-benchmark-with-setup
 test-benchmark-with-setup: deploy-e2e-infra test-benchmark
 
+# Stub for llm-d nightly reusable workflows (test_target=nightly-test-llm-d)
+# No-op; temporarily satisfies nightly CI make invocation
+# TODO: add nightly guide tests here
+.PHONY: nightly-test-llm-d
+nightly-test-llm-d: ## Nightly CI: noop; use as test_target instead of empty string
+	@:
+
+# Shared script: deploy/lib/llm_d_nightly_install.sh
+# Canonical target for llm-d-infra nightly reusables: ENVIRONMENT=openshift|kubernetes
+.PHONY: nightly-deploy-wva-guide
+nightly-deploy-wva-guide: ## Nightly: full WVA+llm-d stack from job env (WVA_NS <- WVA_NAMESPACE or CONTROLLER_NAMESPACE)
+	@export WVA_NS="$${WVA_NS:-$${WVA_NAMESPACE:-$${CONTROLLER_NAMESPACE:-}}}"; \
+	if [ "$${ENVIRONMENT:-}" = openshift ]; then \
+		LLM_D_NIGHTLY_PLATFORM=openshift bash "$(CURDIR)/deploy/lib/llm_d_nightly_install.sh" "$(CURDIR)"; \
+	else \
+		LLM_D_NIGHTLY_PLATFORM=cks bash "$(CURDIR)/deploy/lib/llm_d_nightly_install.sh" "$(CURDIR)"; \
+	fi
+
 .PHONY: lint
 lint: golangci-lint ## Run golangci-lint linter
 	$(GOLANGCI_LINT) run
diff --git a/deploy/lib/llm_d_nightly_install.sh b/deploy/lib/llm_d_nightly_install.sh
@@ -0,0 +1,57 @@
+#!/usr/bin/env bash
+# Shared deploy path for llm-d-infra nightly reusables (CKS + OpenShift).
+# Invoked via: make nightly-deploy-wva-guide (sets LLM_D_NIGHTLY_PLATFORM=cks|openshift).
+set -euo pipefail
+
+ROOT="${1:-.}"
+cd "$ROOT"
+
+PLATFORM="${LLM_D_NIGHTLY_PLATFORM:?LLM_D_NIGHTLY_PLATFORM must be cks or openshift}"
+if [[ "$PLATFORM" != cks && "$PLATFORM" != openshift ]]; then
+	echo "LLM_D_NIGHTLY_PLATFORM must be cks or openshift (got: $PLATFORM)" >&2
+	exit 1
+fi
+
+if [[ -n "${GITHUB_WORKSPACE:-}" && ! -d llm-d && -d "$GITHUB_WORKSPACE/guides" ]]; then
+	ln -sfn "$GITHUB_WORKSPACE" llm-d
+	echo "Symlinked $ROOT/llm-d -> $GITHUB_WORKSPACE"
+fi
+
+if [[ "$PLATFORM" == cks ]]; then
+	for f in deploy/lib/deploy_prometheus_kube_stack.sh deploy/kubernetes/install.sh; do
+		if [[ -f "$f" ]] && grep -q 'helm upgrade --install kube-prometheus-stack' "$f" && ! grep -q 'nodeExporter.enabled=false' "$f"; then
+			perl -pi -e 's/helm upgrade --install kube-prometheus-stack/helm upgrade --install kube-prometheus-stack --set nodeExporter.enabled=false/g' "$f"
+			echo "Patched $f: nodeExporter.enabled=false (CKS nightly)"
+		fi
+	done
+fi
+
+export INSTALL_GATEWAY_CTRLPLANE="${INSTALL_GATEWAY_CTRLPLANE:-false}"
+export BENCHMARK_MODE="${BENCHMARK_MODE:-false}"
+export E2E_TESTS_ENABLED="${E2E_TESTS_ENABLED:-true}"
+export NAMESPACE_SCOPED="${NAMESPACE_SCOPED:-false}"
+export DEPLOY_WVA="${DEPLOY_WVA:-true}"
+export DEPLOY_PROMETHEUS="${DEPLOY_PROMETHEUS:-true}"
+export DEPLOY_PROMETHEUS_ADAPTER="${DEPLOY_PROMETHEUS_ADAPTER:-true}"
+export DEPLOY_VA="${DEPLOY_VA:-false}"
+export DEPLOY_HPA="${DEPLOY_HPA:-false}"
+export SCALER_BACKEND="${SCALER_BACKEND:-keda}"
+export ENABLE_SCALE_TO_ZERO="${ENABLE_SCALE_TO_ZERO:-true}"
+export POOL_GROUP="${POOL_GROUP:-inference.networking.k8s.io}"
+
+if [[ "$PLATFORM" == openshift ]]; then
+	export MONITORING_NAMESPACE="${MONITORING_NAMESPACE:-openshift-user-workload-monitoring}"
+	export WVA_METRICS_SECURE="${WVA_METRICS_SECURE:-false}"
+	export ENVIRONMENT=openshift
+	./deploy/install.sh \
+		--model "${MODEL_ID:-unsloth/Meta-Llama-3.1-8B}" \
+		--accelerator "${ACCELERATOR_TYPE:-H100}" \
+		--release-name "${WVA_RELEASE_NAME:-workload-variant-autoscaler}" \
+		--environment openshift
+else
+	export ENVIRONMENT=kubernetes
+	./deploy/install.sh \
+		--model "${MODEL_ID:-unsloth/Meta-Llama-3.1-8B}" \
+		--accelerator "${ACCELERATOR_TYPE:-H100}" \
+		--release-name "${WVA_RELEASE_NAME:-workload-variant-autoscaler}"
+fi