fix use of dtypes in autoencoder tests

catwell · catwell · commit 8b0966530f0f · 2024-11-28T15:34:29.000+01:00
diff --git a/src/refiners/foundationals/latent_diffusion/auto_encoder.py b/src/refiners/foundationals/latent_diffusion/auto_encoder.py
@@ -415,8 +415,8 @@ def _generate_latent_tiles(size: _ImageSize, tile_size: _ImageSize, overlap: int
         """
         tiles: list[_Tile] = []
 
-        for x in range(0, max(size.width - overlap, 1), tile_size.width - overlap):
-            for y in range(0, max(size.height - overlap, 1), tile_size.height - overlap):
+        for x in range(0, size.width, tile_size.width - overlap):
+            for y in range(0, size.height, tile_size.height - overlap):
                 tile = _Tile(
                     top=max(0, y),
                     left=max(0, x),
diff --git a/tests/foundationals/latent_diffusion/test_autoencoders.py b/tests/foundationals/latent_diffusion/test_autoencoders.py
@@ -34,15 +34,10 @@ def autoencoder(
     test_dtype_fp32_bf16_fp16: torch.dtype,
 ) -> LatentDiffusionAutoencoder:
     model_version = request.param
-    match (model_version, test_dtype_fp32_bf16_fp16):
-        case ("SD1.5", _):
-            return refiners_sd15_autoencoder.to(device=test_device, dtype=test_dtype_fp32_bf16_fp16)
-        case ("SDXL", torch.float16):
-            return refiners_sdxl_autoencoder.to(device=test_device, dtype=test_dtype_fp32_bf16_fp16)
-        case ("SDXL", _):
-            return refiners_sdxl_autoencoder.to(device=test_device, dtype=test_dtype_fp32_bf16_fp16)
-        case _:
-            raise ValueError(f"Unknown model version: {model_version}")
+    if model_version == "SDXL" and test_dtype_fp32_bf16_fp16 == torch.float16:
+        pytest.skip("SDXL autoencoder does not support float16")
+    ae = refiners_sd15_autoencoder if model_version == "SD1.5" else refiners_sdxl_autoencoder
+    return ae.to(device=test_device, dtype=test_dtype_fp32_bf16_fp16)
 
 
 @no_grad()
@@ -112,30 +107,6 @@ def test_tiled_autoencoder_rectangular_image(autoencoder: LatentDiffusionAutoenc
     ensure_similar_images(sample_image, result, min_psnr=37, min_ssim=0.985)
 
 
-@no_grad()
-@pytest.fixture(scope="module", params=[240, 242, 244, 254, 256, 258])
-def test_tiled_autoencoder_pathologic_sizes(
-    request: pytest.FixtureRequest,
-    refiners_sd15_autoencoder: SD1Autoencoder,
-    sample_image: Image.Image,
-    test_device: torch.device,
-):
-    # 242 is a tile just larger than (tile size - overlap).
-    # 242 * 4 = 968 = (128 - 8 + 1) * 8
-    tile_w = request.param
-
-    autoencoder = refiners_sd15_autoencoder.to(device=test_device, dtype=torch.float32)
-
-    sample_image = sample_image.crop((0, 0, tile_w, 400))
-    sample_image = sample_image.resize((sample_image.width * 4, sample_image.height * 4))
-
-    with autoencoder.tiled_inference(sample_image, tile_size=(1024, 1024)):
-        encoded = autoencoder.tiled_image_to_latents(sample_image)
-        result = autoencoder.tiled_latents_to_image(encoded)
-
-    ensure_similar_images(sample_image, result, min_psnr=37, min_ssim=0.985)
-
-
 def test_value_error_tile_encode_no_context(autoencoder: LatentDiffusionAutoencoder, sample_image: Image.Image) -> None:
     with pytest.raises(ValueError):
         autoencoder.tiled_image_to_latents(sample_image)