minor fixes

andrey-churkin · andrey-churkin · commit fa04951d40d1 · 2025-04-03T21:28:38.000+01:00
diff --git a/nncf/onnx/graph/nncf_graph_builder.py b/nncf/onnx/graph/nncf_graph_builder.py
@@ -338,7 +338,23 @@ def convert_onnx_dtype_to_nncf_dtype(onnx_dtype: int) -> Dtype:
         return Dtype.FLOAT if onnx_dtype == int(onnx.TensorProto.FLOAT) else Dtype.INTEGER
 
     @staticmethod
-    def create_nncf_graph(onnx_model: onnx.ModelProto) -> NNCFGraph:
+    def preprocess_model(model: onnx.ModelProto) -> onnx.ModelProto:
+        """
+        Applies the following transformations to the input model:
+            - Replace empty node names
+            - Infer shapes
+            - Eliminate nop casts
+
+        :param model: Input model.
+        :return: Preprocessed model.
+        """
+        preprocessed_model = GraphConverter._replace_empty_node_name(model)
+        preprocessed_model = onnx.shape_inference.infer_shapes(preprocessed_model)
+        preprocessed_model = onnxoptimizer.optimize(preprocessed_model, ["eliminate_nop_cast"])
+        return preprocessed_model
+
+    @staticmethod
+    def create_nncf_graph(onnx_model: onnx.ModelProto, preprocess_model: bool = True) -> NNCFGraph:
         """
         Creates NNCFGraph from 'onnx_model'.
         Initially, ONNXGraph is built. All nodes from onnx_model which have valid metatype are added to NNCFGraph.
@@ -347,9 +363,9 @@ def create_nncf_graph(onnx_model: onnx.ModelProto) -> NNCFGraph:
         :param onnx_model: ONNX model.
         :return: NNCFGraph.
         """
-        onnx_model = GraphConverter._replace_empty_node_name(onnx_model)
-        onnx_model = onnx.shape_inference.infer_shapes(onnx_model)
-        onnx_model = onnxoptimizer.optimize(onnx_model, ["eliminate_nop_cast"])
+        if preprocess_model:
+            onnx_model = GraphConverter.preprocess_model(onnx_model)
+
         edge_info_mapping = get_edge_info_mapping(onnx_model)
         children_node_mapping = get_children_node_mapping(onnx_model)
         parents_node_mapping = get_parents_node_mapping(onnx_model)
diff --git a/nncf/onnx/quantization/quantize_model.py b/nncf/onnx/quantization/quantize_model.py
@@ -81,7 +81,8 @@ def quantize_impl(
         advanced_parameters=advanced_parameters,
     )
 
-    graph = GraphConverter.create_nncf_graph(model)
+    model = GraphConverter.preprocess_model(model)
+    graph = GraphConverter.create_nncf_graph(model, preprocess_model=False)
     warning_model_no_batchwise_support(graph, advanced_parameters, model_type, OPERATIONS_OUTPUT_HAS_NO_BATCH_AXIS)
     quantized_model = quantization_algorithm.apply(model, graph, dataset=calibration_dataset)
 

Original file line number	Diff line number	Diff line change
`@@ -81,7 +81,8 @@ def quantize_impl(`
`81`	`81`	`advanced_parameters=advanced_parameters,`
`82`	`82`	`)`
`83`	`83`
`84`		`- graph = GraphConverter.create_nncf_graph(model)`
	`84`	`+ model = GraphConverter.preprocess_model(model)`
	`85`	`+ graph = GraphConverter.create_nncf_graph(model, preprocess_model=False)`
`85`	`86`	`warning_model_no_batchwise_support(graph, advanced_parameters, model_type, OPERATIONS_OUTPUT_HAS_NO_BATCH_AXIS)`
`86`	`87`	`quantized_model = quantization_algorithm.apply(model, graph, dataset=calibration_dataset)`
`87`	`88`