Skip TRTLLM providers in bench when extension is unavailable

sunnycase · sunnycase · commit 4f221509b4dd · 2026-04-07T02:25:48.000Z
diff --git a/python/tutorials/tle/deepseek_v32/01-topk_selector.py b/python/tutorials/tle/deepseek_v32/01-topk_selector.py
@@ -3794,7 +3794,7 @@ def run():
 
     elif provider == "trtllm-decode":
         if _load_embedded_trtllm_indexer_topk() is None:
-            raise RuntimeError("TRT-LLM indexerTopK extension unavailable")
+            return float("nan"), float("nan"), float("nan")
         trtllm_out = torch.full((batch, topk), -1, dtype=torch.int32, device=x.device)
         trtllm_out_logits_aux = torch.empty((batch, 10 * topk), dtype=torch.float32, device=x.device)
         trtllm_out_indices_aux = torch.empty((batch, 10 * topk), dtype=torch.int32, device=x.device)
@@ -3812,7 +3812,7 @@ def run():
 
     elif provider == "trtllm-prefill":
         if _load_embedded_trtllm_indexer_topk() is None:
-            raise RuntimeError("TRT-LLM indexerTopK extension unavailable")
+            return float("nan"), float("nan"), float("nan")
         trtllm_out = torch.full((batch, topk), -1, dtype=torch.int32, device=x.device)
 
         def run():
@@ -3826,7 +3826,7 @@ def run():
 
     elif provider == "trtllm-prefill-1024threads":
         if _load_embedded_trtllm_indexer_topk(prefill_threads=1024) is None:
-            raise RuntimeError("TRT-LLM indexerTopK extension unavailable")
+            return float("nan"), float("nan"), float("nan")
         trtllm_out = torch.full((batch, topk), -1, dtype=torch.int32, device=x.device)
 
         def run():