HuBERT Fine-tuning for CTC ASR

This project demonstrates how to fine-tune a HuBERT model for Connectionist Temporal Classification (CTC) Automatic Speech Recognition (ASR).

Project Description

This project focuses on training a self-supervised learning (SSL) model and evaluating its performance on a downstream task in Cantonese. It fine-tunes a pre-trained HuBERT model on a speech dataset for automatic speech recognition (ASR) using the Connectionist Temporal Classification (CTC) loss function. The goal is to achieve high accuracy in Cantonese speech recognition.

Setup

Install dependencies:
```
pip install -r requirements.txt
```
Prepare the dataset:
- Download and extract the desired speech dataset.
- Modify the train.py script to point to the correct dataset location and configuration.

Usage

To train the model, run the train.py script:

python train.py

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
cline_docs		cline_docs
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

HuBERT Fine-tuning for CTC ASR

Project Description

Setup

Usage

About

Uh oh!

Releases

Packages

Uh oh!

Languages

hon9kon9ize/yue-ssl-eval

Folders and files

Latest commit

History

Repository files navigation

HuBERT Fine-tuning for CTC ASR

Project Description

Setup

Usage

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages