Sanskrit-to-English Neural Machine Translation

A character-level Transformer model for translating English text to Sanskrit using PyTorch.

Overview

This project implements a complete neural machine translation system that converts English text to Sanskrit (Devanagari script) using a Transformer architecture with multi-head attention mechanisms.

Features

Transformer Architecture: Full encoder-decoder with multi-head attention
Character-Level Translation: Fine-grained tokenization for better accuracy
Complete Vocabulary: Comprehensive Sanskrit character set

Quick Start

1. Install Dependencies

pip install torch numpy matplotlib jupyter

2. Train the Model (Optional)

cd transformer/
jupyter notebook final_transformer.ipynb
# Run all cells to train from scratch

Model Architecture

Type: Encoder-Decoder Transformer
Dimensions: 512 (d_model), 2048 (FFN)
Attention Heads: 8
Layers: 1 (configurable)
Vocabulary: 89 Sanskrit + 183 English characters
Max Length: 200 characters
Training: Adam optimizer, Cross-entropy loss

Sample Translations:

"I am here" → अहम् अत्र अस्मि
"Do work don't expect result" → कर्म कुर्वन्तु फलं मा प्रत्याशयन्तु

Technical Details

Framework: PyTorch 2.0+
Training Data: English-Sanskrit parallel corpus
Tokenization: Character-level with special tokens
Attention: Multi-head self-attention + cross-attention
Masking: Look-ahead and padding masks

Training Process

Data Preparation: Filter valid sentence pairs
Vocabulary Building: Character-level tokenization
Model Initialization: Xavier uniform weights
Training Loop: 50 epoch with checkpoint saving
Evaluation: Real-time translation testing

Performance

Training: ~50 epochs on parallel corpus
Inference: Real-time character generation
Accuracy: Not accurate/Accurate over large corpus

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
data		data
encoder_decoder_with_lstm		encoder_decoder_with_lstm
models		models
screenshots		screenshots
transformer		transformer
.gitignore		.gitignore
readme.md		readme.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sanskrit-to-English Neural Machine Translation

Overview

Features

Quick Start

1. Install Dependencies

2. Train the Model (Optional)

Model Architecture

Sample Translations:

Technical Details

Training Process

Performance

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Sanskrit-to-English Neural Machine Translation

Overview

Features

Quick Start

1. Install Dependencies

2. Train the Model (Optional)

Model Architecture

Sample Translations:

Technical Details

Training Process

Performance

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages