support mtp layer support for qwen3.5 series models by zpltys · Pull Request #98 · ISEEKYAN/mbridge

zpltys · 2026-03-20T09:39:31Z

support qwen3.5 models' mtp layer.
I have test the correctness in example/qwen3_5/test_mtp_logits.py file and e2e sft training on qwen3.5 35ba3b and 9b

ArronHZG · 2026-03-20T09:47:48Z

How does the mtp_loss_scaling_factor take effect?
Also, how do I load a model and disable MTP?

ArronHZG · 2026-03-20T09:49:48Z

def _build_config(self):
    """Override to add MTP configuration."""
    hf_config = self.hf_config

    # Add MTP configuration if present
    mtp_args = {}
    if "num_nextn_predict_layers" in hf_config:
        mtp_args["mtp_num_layers"] = hf_config.num_nextn_predict_layers
        mtp_args["mtp_loss_scaling_factor"] = self.extra_args.get("mtp_loss_scaling_factor", 0.1)

    return self._build_base_config(
        add_qkv_bias=True,
        qk_layernorm=False,
        **mtp_args,
    )

just like this.

zpltys · 2026-03-24T06:36:54Z

How does the mtp_loss_scaling_factor take effect? Also, how do I load a model and disable MTP?

I have fix this

support mtp layer support for qwen3.5 series models

2cca32c

support qwen3.5 mtp config to enable/disable mtp layer

2d2692a

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

support mtp layer support for qwen3.5 series models#98

support mtp layer support for qwen3.5 series models#98
zpltys wants to merge 2 commits intoISEEKYAN:mainfrom
zpltys:qwen35_mtp

zpltys commented Mar 20, 2026

Uh oh!

ArronHZG commented Mar 20, 2026

Uh oh!

ArronHZG commented Mar 20, 2026

Uh oh!

zpltys commented Mar 24, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

zpltys commented Mar 20, 2026

Uh oh!

ArronHZG commented Mar 20, 2026

Uh oh!

ArronHZG commented Mar 20, 2026

Uh oh!

zpltys commented Mar 24, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants