flashinfer-ai · nv-yunzheq · Feb 21, 2026 · Feb 10, 2026 · Feb 10, 2026 · Feb 11, 2026
@@ -134,7 +134,7 @@ def parse_gemm_args(line, parser):
         required=False,
         nargs="+",
         default=["cudnn"],
-        choices=["cudnn", "cublas", "trtllm", "cutlass", "auto"],
+        choices=["cudnn", "cublas", "trtllm", "cutlass", "cute-dsl", "auto"],
         help="Kernel backends to test. Default: cudnn",
     )
     parser.add_argument(
@@ -1004,7 +1004,7 @@ def testMmFp4(args):
     run_refcheck = args.refcheck
     use_128x4_sf_layout = args.use_128x4_sf_layout
     use_nvfp4 = args.use_nvfp4
-    autotune_supported_backends = ["cudnn", "cutlass", "trtllm", "auto"]
+    autotune_supported_backends = ["cudnn", "cutlass", "trtllm", "cute-dsl", "auto"]
     res = []
 
     res_dtype = dtype_str_to_torch_dtype(args.out_dtype)
@@ -1104,7 +1104,7 @@ def run_backend(
         mat2_inv_s,
         mat2_inv_s_trtllm,
     ):
-        if backend in ["cudnn", "trtllm", "cutlass", "auto"]:
+        if backend in ["cudnn", "trtllm", "cutlass", "cute-dsl", "auto"]:
             return flashinfer.gemm.mm_fp4(
                 a=input_fp4,
                 b=mat2_fp4.T if backend != "trtllm" else mat2_fp4_trtllm.T,