VLM Vision Experiments

This repository contains experiments and explorations with NVIDIA's Vision Language Model (VLM) API. Each experiment is documented in its own directory with detailed README files.

Structure

experiments/: Contains individual experiment directories
common/: Shared utilities and helper functions
requirements.txt: Project dependencies

Experiments

ID Card Information Extraction: Extract structured information from Spanish ID cards using VLM API

Setup

Clone this repository
Create a .env file in the project root

Add your NVIDIA API key:

NVIDIA_API_KEY=your_actual_api_key_here

Install dependencies:
```
pip install -r requirements.txt
```

Security

NEVER commit your API keys to version control
Use environment variables to manage sensitive credentials

Contributing

Each new experiment should:

Have its own directory under experiments/
Include a detailed README.md
Document findings and learnings
Include sample data (if not sensitive)

License

MIT License - See LICENSE file for details

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
experiments/01_id_card_extraction		experiments/01_id_card_extraction
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VLM Vision Experiments

Structure

Experiments

Setup

Security

Contributing

License

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

raghunanj/vlm-vision-experiments

Folders and files

Latest commit

History

Repository files navigation

VLM Vision Experiments

Structure

Experiments

Setup

Security

Contributing

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages