huggingface · echarlaix · Oct 8, 2025 · Oct 8, 2025
diff --git a/optimum/intel/openvino/quantization.py b/optimum/intel/openvino/quantization.py
@@ -1440,6 +1440,15 @@ def _quantize_ovbasemodel(
                     quantized_model = _mixed_quantization(submodel, config, nncf_dataset, **kwargs)
 
                 # Replace the original model with the quantized model
+                if isinstance(self.model, OVModelForVisualCausalLM):
+                    # Special handling of submodels in OVModelForVisualCausalLM
+                    # TODO (nikita.savelyevv): Implement a proper fix including other model types
+                    if submodel_name == "lm_model":
+                        self.model.language_model.model = quantized_model
+                    elif submodel_name == "text_embeddings_model":
+                        self.model.language_model.text_emb_model = quantized_model
+                    elif submodel_name == "vision_embeddings_model":
+                        self.model.vision_embeddings.model = quantized_model
                 if isinstance(getattr(self.model, submodel_name), openvino.Model):
                     setattr(self.model, submodel_name, quantized_model)
                 elif isinstance(getattr(getattr(self.model, submodel_name), "model"), openvino.Model):