IBM · elronbandel · Mar 18, 2025 · Mar 17, 2025 · Mar 17, 2025 · Mar 17, 2025
diff --git a/examples/inference_using_ibm_watsonx_ai.py b/examples/inference_using_ibm_watsonx_ai.py
@@ -1,18 +1,17 @@
-import os
 
 from unitxt.api import load_dataset
-from unitxt.inference import WMLInferenceEngine
+from unitxt.inference import WMLInferenceEngineGeneration
 from unitxt.text_utils import print_dict
 
 if __name__ == "__main__":
     # Set required env variables using your WML credentials:
-    os.environ["WML_URL"] = ""
-    os.environ["WML_PROJECT_ID"] = ""
-    os.environ["WML_APIKEY"] = ""
+    # os.environ["WML_URL"] = ""
+    # os.environ["WML_PROJECT_ID"] = ""
+    # os.environ["WML_APIKEY"] = ""
 
     # Preparing WML inference engine:
     model_name = "google/flan-t5-xl"
-    wml_inference = WMLInferenceEngine(
+    wml_inference = WMLInferenceEngineGeneration(
         model_name=model_name,
         data_classification_policy=["public"],
         random_seed=111,

diff --git a/src/unitxt/inference.py b/src/unitxt/inference.py
@@ -245,8 +245,8 @@ def infer(
                         else:
                             missing_examples.append((i, item)) # each element is index in batch and example
                     # infare on missing examples only, without indices
-                    logger.info(f"Inferring batch {batch_num} / {len(dataset) // self.cache_batch_size}")
-                    if len(missing_examples) > 0:
+                    logger.info(f"Inferring batch {batch_num} / {len(dataset) // self.cache_batch_size} with {len(missing_examples)} instances (found {len(cached_results)} instances in {self._cache.directory})")
+                    if (len(missing_examples) > 0):
                         inferred_results = self._infer([e[1] for e in missing_examples], return_meta_data)
                         # recombined to index and value
                         inferred_results = list(zip([e[0] for e in missing_examples], inferred_results))
@@ -257,6 +257,7 @@ def infer(
                             cache_key = self._get_cache_key(item)
                             self._cache[cache_key] = prediction
                     else:
+
                         inferred_results = []
 
                     # Combine cached and inferred results in original order