GGUF-Mojo

A pure Mojo implementation for parsing GGUF (GPT-Generated Unified Format) model files.

Overview

This project provides a minimal prototype GGUF parser implemented entirely in Mojo, without external C library dependencies. GGUF is a binary format used to store large language models and their metadata.

Features

Pure Mojo Implementation: No external C dependencies
GGUF Header Parsing: Reads magic number, version, and counts
Binary Data Reading: Little-endian UInt32/UInt64 parsing
Extensible Design: Foundation for metadata and tensor parsing
Validation: Built-in format validation and error handling

Files

gguf_parser.mojo - Core parser implementation
main.mojo - Main demonstration program
example.mojo - Usage examples
extern_gguf.mojo - Original C library bindings (for reference)

GGUF File Format

GGUF files have the following structure:

Header (24 bytes)
- Magic number: 0x46554747 ("GGUF" in little-endian)
- Version: 3 (current specification)
- Tensor count: Number of tensors in the file
- Metadata count: Number of key-value pairs
Metadata (variable length)
- Key-value pairs with type information
- Supports strings, numbers, arrays, etc.
Tensor Information (variable length)
- Tensor headers with names, types, dimensions
Tensor Data (variable length, aligned)
- Raw tensor weight data

Usage

Basic Usage

from gguf_parser import GGUFParser

def main():
    var parser = GGUFParser()
    
    # Demo parsing with in-memory data
    let success = parser.demo_parse()
    
    if success:
        print("GGUF header parsed successfully!")

Running the Examples

# Run main demonstration
mojo main.mojo

# Run usage examples
mojo example.mojo

Current Implementation Status

✅ Completed:

GGUF header parsing (magic, version, counts)
Binary data reading utilities (UInt32, UInt64)
Basic validation and error handling
In-memory demo data parsing
Extensible parser structure

🚧 Future Extensions:

File I/O integration
Complete metadata value parsing
Tensor information parsing
Tensor data reading
Advanced error handling

Technical Details

Parser Architecture

The GGUFParser struct provides:

demo_parse() - Demonstrates header parsing with sample data
read_uint32() - Reads 32-bit little-endian integers
read_uint64() - Reads 64-bit little-endian integers
parse_header() - Validates and parses GGUF headers

Data Types

GGUFHeader - Header information structure
DynamicVector[UInt8] - Binary data storage
Little-endian binary format support

Validation

A Python validation script confirms the implementation correctness:

python3 /tmp/validate_gguf.py

This validates:

GGUF magic number constants
Binary data layout (little-endian)
Creates test GGUF files

Examples

Header Parsing Output

GGUF Header parsed successfully:
  Magic: 1179993927
  Version: 3
  Tensor count: 0
  Metadata KV count: 0

Contributing

This is a prototype implementation. Future contributions could include:

File I/O integration for real GGUF files
Complete metadata parsing with all value types
Tensor information and data parsing
Performance optimizations
Error handling improvements

License

This project follows the same license as the parent repository.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
ggml @ b2a5c34		ggml @ b2a5c34
gguf-tools @ af7d88d		gguf-tools @ af7d88d
.gitmodules		.gitmodules
Makefile		Makefile
README.md		README.md
example.mojo		example.mojo
extern_gguf.mojo		extern_gguf.mojo
gguf_parser.mojo		gguf_parser.mojo
main.mojo		main.mojo
union_experiment.mojo		union_experiment.mojo

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

GGUF-Mojo

Overview

Features

Files

GGUF File Format

Usage

Basic Usage

Running the Examples

Current Implementation Status

Technical Details

Parser Architecture

Data Types

Validation

Examples

Header Parsing Output

Contributing

License

References

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

jagtesh/gguf-mojo

Folders and files

Latest commit

History

Repository files navigation

GGUF-Mojo

Overview

Features

Files

GGUF File Format

Usage

Basic Usage

Running the Examples

Current Implementation Status

Technical Details

Parser Architecture

Data Types

Validation

Examples

Header Parsing Output

Contributing

License

References

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages