[DRAFT] [NO_MERGE] GPTQv2 for llama-mx by stamalakhov · Pull Request #782 · Samsung/TICO

stamalakhov · 2026-06-15T14:06:02Z

This draft assesses GPTQv2 for llama mx quantization.

results for HuggingFaceTB/SmolLM2-135M-Instruct mx (all activations for matmul, rms_norm and softmax are mxint8 ) quantization

Config ID	PPL
FP32	17.38
GPTQv2+PTQ_mse_256_samples	22.73
GPTQv2,PTQ_mse_256_samples	22.81
SPQ_GPTQv2+PTQ_mse_128_samples_adapt_percdamp	19.87
SPQ_GPTQv2+PTQ_mse_256_samples_adapt_percdamp	19.93
SPQ_GPTQv2+PTQ_smse_128_samples_adapt_percdamp	19.87
SPQ_GPTQv2+PTQ_mse_for_gptq_128_samples_adapt_percdamp	19.72
SPQ_GPTQv2+PTQ_mse_for_gptq_256_samples_adapt_percdamp	19.66
SPQ_GPTQv2+PTQ_smse_for_gptq_128_samples_adapt_percdamp	19.97

This draft tries to get fully quantized model. TICO-DCO-1.0-Signed-off-by: s.malakhov <s.malakhov@partner.samsung.com>

TICO-DCO-1.0-Signed-off-by: s.malakhov <s.malakhov@partner.samsung.com>

stamalakhov added 3 commits June 4, 2026 09:58

[quantization] Full quantization

e49432b

This draft tries to get fully quantized model. TICO-DCO-1.0-Signed-off-by: s.malakhov <s.malakhov@partner.samsung.com>

Introduce llama_quantizer

1b8c432

TICO-DCO-1.0-Signed-off-by: s.malakhov <s.malakhov@partner.samsung.com>

Introduce adaptive percdamp

be738fd

TICO-DCO-1.0-Signed-off-by: s.malakhov <s.malakhov@partner.samsung.com>

stamalakhov force-pushed the llama_gptqv2_mx branch from 45e18ff to be738fd Compare June 19, 2026 05:36

stamalakhov added 2 commits June 19, 2026 15:10

Introduce batch.

f3934c4

TICO-DCO-1.0-Signed-off-by: s.malakhov <s.malakhov@partner.samsung.com>

Add use_iterate

93b9de5

TICO-DCO-1.0-Signed-off-by: s.malakhov <s.malakhov@partner.samsung.com>

stamalakhov force-pushed the llama_gptqv2_mx branch from d04317f to 93b9de5 Compare June 19, 2026 13:48

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[DRAFT] [NO_MERGE] GPTQv2 for llama-mx#782

[DRAFT] [NO_MERGE] GPTQv2 for llama-mx#782
stamalakhov wants to merge 5 commits into
Samsung:mainfrom
stamalakhov:llama_gptqv2_mx

stamalakhov commented Jun 15, 2026 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

stamalakhov commented Jun 15, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

stamalakhov commented Jun 15, 2026 •

edited

Loading