Sync master with upstream release b8671 by jan-service-account · Pull Request #477 · janhq/llama.cpp

jan-service-account · 2026-04-06T00:55:15Z

Updates dev branch with latest release (b8671) from ggml-org/llama.cpp

…-org#21413) Signed-off-by: Adrien Gallouët <angt@huggingface.co>

…ml-org#21201) Co-authored-by: Dan Hoffman <dhoffman@cyket.net>

* common : add gemma4 dedicated parser * cont : add '<|tool_response>' as eog * cont : emit JSON from Gemma4 tool call AST * cont : more fixes * cont : refactor convert function * cont : refine rules and mapping * cont : add more tests * cont : clean up * cont : remove autoparser gemma4 implementation * cont : more cleanup * cont : rename gemma4.jinja to match the others * cont : add custom template to support interleaved thinking * cont : preserve reasoning in model turns * cont : fix initializer error * cont : fix unused vars * cont : fix accidental static * cont : fix specialized_template signature * fix extra semicolon * remove debug line and extra space [no ci]

…-org#21438) Co-authored-by: M1DNYT3 <m1dnyt3@MacBookPro.lan>

This PR changes the logging that occurs at startup of llama-server. Currently, it is redundant (including CPU information twice) and it is missing the build + commit info.

* HunyuanOCR: add support for text and vision models - Add HunyuanOCR vision projector (perceiver-based) with Conv2d merge - Add separate HUNYUAN_OCR chat template (content-before-role format) - Handle HunyuanOCR's invalid pad_token_id=-1 in converter - Fix EOS/EOT token IDs from generation_config.json - Support xdrope RoPE scaling type - Add tensor mappings for perceiver projector (mm.before_rms, mm.after_rms, etc.) - Register HunYuanVLForConditionalGeneration for both text and mmproj conversion * fix proper mapping * Update gguf-py/gguf/tensor_mapping.py Co-authored-by: Xuan-Son Nguyen <thichthat@gmail.com> * Update tools/mtmd/clip.cpp Co-authored-by: Xuan-Son Nguyen <thichthat@gmail.com> * address comments * update * Fix typecheck * Update convert_hf_to_gguf.py Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com> * Update convert_hf_to_gguf.py Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com> * Update convert_hf_to_gguf.py Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com> * Update convert_hf_to_gguf.py Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com> --------- Co-authored-by: Xuan-Son Nguyen <thichthat@gmail.com> Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

…rg#21428) * model-loader : fix GGUF bool array conversion * model-loader : fix remaining GGUF bool pointer uses

am17an and others added 11 commits April 4, 2026 15:06

llama: add custom newline split for Gemma 4 (ggml-org#21406)

b7ad48e

llama-model: read final_logit_softcapping for Gemma 4 (ggml-org#21390)

650bf14

common : respect specified tag, only fallback when tag is empty (ggml…

d01f627

…-org#21413) Signed-off-by: Adrien Gallouët <angt@huggingface.co>

server: Fix undefined timing measurement errors in server context (gg…

9c69907

…ml-org#21201) Co-authored-by: Dan Hoffman <dhoffman@cyket.net>

ci: fix vulkan workflow referencing non-existent action (ggml-org#21442)

661e9ac

ci: lower cuda12 floor to 12.8.1 for broader host compatibility (ggml…

c08d28d

…-org#21438) Co-authored-by: M1DNYT3 <m1dnyt3@MacBookPro.lan>

server : fix logging of build + system info (ggml-org#21460)

5d3a4a7

This PR changes the logging that occurs at startup of llama-server. Currently, it is redundant (including CPU information twice) and it is missing the build + commit info.

ci : use default RISE RISC-V Runners (ggml-org#21263)

761797f

llama : correct platform-independent loading of BOOL metadata (ggml-o…

58190cc

…rg#21428) * model-loader : fix GGUF bool array conversion * model-loader : fix remaining GGUF bool pointer uses

jan-service-account merged commit 7f603a4 into dev Apr 6, 2026
3 checks passed

jan-service-account deleted the update-dev-from-master-2026-04-06-00-55 branch April 6, 2026 00:57

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Sync master with upstream release b8671#477

Sync master with upstream release b8671#477
jan-service-account merged 11 commits into
devfrom
update-dev-from-master-2026-04-06-00-55

jan-service-account commented Apr 6, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

12 participants

Conversation

jan-service-account commented Apr 6, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

12 participants