[NvTesnorRtRtx] Add mixed precision nvModelOpt recipes for Phi 4 mini instruct by ynankani · Pull Request #242 · microsoft/olive-recipes

ynankani · 2026-02-16T06:16:10Z

Add mixed precision NvModelOpt recipes for Phi-4-mini-instruct

Observed improvement in mmlu and perplexity score for the above model with mixed (Int4+Int8) precision quantization compared to standard int4 quantization.

MMLU
Model	FP16-MB	Mixed AWQ -MO	Mixed RTN-MO	Pure INT4 AWQ-MO	Pure INT4 RTN-MO
Phi-4-mini-instruct	66.70%	65.00%	65.20%	64.10%	61.60%

Perplexity (isl=1024, stride=512)
Model	FP16-MB	Mixed AWQ -MO	Mixed RTN-MO	Pure INT4 AWQ-MO	Pure INT4 RTN-MO
Phi-4-mini-instruct	9.039	9.673	9.712	10.015	10.911

…-instruct Signed-off-by: unknown <ynankani@nvidia.com>

ynankani · 2026-02-16T06:18:39Z

Please review, merge.

CC @devang-ml

ynankani added 2 commits February 16, 2026 11:27

[NvTesnorRtRtx] Add mixed precision nvModelOpt recipes for Phi-4-mini…

a81f5ec

…-instruct Signed-off-by: unknown <ynankani@nvidia.com>

[NvTesnorRtRtx] Add mixed precision nvModelOpt recipes for Phi-4-mini…

a8b7219

…-instruct Signed-off-by: unknown <ynankani@nvidia.com>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[NvTesnorRtRtx] Add mixed precision nvModelOpt recipes for Phi 4 mini instruct #242

[NvTesnorRtRtx] Add mixed precision nvModelOpt recipes for Phi 4 mini instruct #242
ynankani wants to merge 2 commits intomicrosoft:mainfrom
ynankani:phi-4-mini-instruct-nvtensorrtrtx-recipe

ynankani commented Feb 16, 2026

Uh oh!

ynankani commented Feb 16, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

ynankani commented Feb 16, 2026

Uh oh!

ynankani commented Feb 16, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant