sriharshapy

sriharsha sriharshapy

I am an AI Grad student at Northeastern University.

Achievements

Sigmoid-TopK-Fusion Sigmoid-TopK-Fusion Public

Fused Sigmoid+TopK Triton kernel for MoE routing — 3.1x faster than PyTorch baseline. Inspired by Sarvam AI's sovereign model inference stack.

Jupyter Notebook 2
High-Performance-Reduction-Kernels High-Performance-Reduction-Kernels Public

CUDA C reduction kernels benchmarking with Triton, PyTorch and CUB primitives

Jupyter Notebook 5 1
mossformer2-denoise mossformer2-denoise Public

Production-ready MossFormer2_SE_48K speech denoising — reference Python (clearvoice + PyTorch) and lean Rust (ONNX ▎ Runtime) Docker containers with matching CLIs. Includes reproducible ONNX expor…

Jupyter Notebook