THUDM · jairuigou · Feb 9, 2026
diff --git a/slime/backends/megatron_utils/megatron_to_hf/__init__.py b/slime/backends/megatron_utils/megatron_to_hf/__init__.py
@@ -11,10 +11,9 @@
 
 
 # TODO unify w/ `convert_to_hf`
-def postprocess_hf_param(args, megatron_param_name, hf_param_name, param):
+def postprocess_hf_param(args, megatron_param_name, hf_param_name, param, quantization_config=None):
     param = remove_padding(megatron_param_name, param, args.vocab_size)
-    # TODO support quant
-    return param
+    return quantize_params(args, megatron_param_name, [(hf_param_name, param)], quantization_config)
 
 
 # TODO optimize code details

diff --git a/slime/backends/megatron_utils/update_weight/hf_weight_iterator_bridge.py b/slime/backends/megatron_utils/update_weight/hf_weight_iterator_bridge.py
@@ -27,20 +27,19 @@ def get_hf_weight_chunks(self, megatron_local_weights):
 
             named_weights = self._bridge.export_hf_weights(self.model, cpu=False, conversion_tasks=conversion_tasks)
 
-            named_weights = (
-                (
-                    hf_param_name,
-                    postprocess_hf_param(
-                        args=self.args,
-                        megatron_param_name=megatron_param_name,
-                        hf_param_name=hf_param_name,
-                        param=weight,
-                    ),
-                )
+            processed_weights = (
+                processed
                 for hf_param_name, weight, megatron_param_name in named_weights
+                for processed in postprocess_hf_param(
+                    args=self.args,
+                    megatron_param_name=megatron_param_name,
+                    hf_param_name=hf_param_name,
+                    param=weight,
+                    quantization_config=self.quantization_config,
+                )
             )
 
-            yield from chunk_named_params_by_size(named_weights, chunk_size=self.args.update_weight_buffer_size)
+            yield from chunk_named_params_by_size(processed_weights, chunk_size=self.args.update_weight_buffer_size)
 
 
 def _process_conversion_tasks(vanilla_conversion_tasks, new_weight_dict):