Release v0.1.0-alpha · a-n-rose/Python-Sound-Tool

An experimental Python framework for sound visualization, analysis, augmentation, filtering as well as machine learning.

Basic functionality for preparing audio datasets (e.g. formatting them), filtering audio, visualizing audio and its features (signal, stft, powspec, fbank, mfcc), augmenting audio for machine learning, and building/implementing basic neural networks for simple speech recognition, speech classification (e.g. language, gender or sex, emotion, etc.), and denoising.

Might be a bit buggy still.

keywords:
audio file format conversion, dataset preparation, wiener filter, convolutional neural networks, cnn, conv, lstm, long short-term memory network, cnn+lstm, cnnlstm, convlstm, autoencoder, denoiser, speech recognition, environment classification, scene classification, language classification, denoising, augmentation, feature extraction, mel-filterbank energies, fbank, mel-frequency cepstral coefficients, mfcc, short-time fourier transfrom, stft, raw signal.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

v0.1.0-alpha