OpenVoiceChanger

실시간 AI 보이스 체인저 웹 애플리케이션.
ONNX 또는 RVC 모델을 낮은 지연의 WebSocket 오디오 파이프라인으로 연결합니다.

빠른 시작 • 모델 지원 • API • 설정 • English • 日本語

기능

AudioWorklet + 바이너리 WebSocket 기반 실시간 음성 변환
ONNX와 RVC 모델 지원
브라우저에서 입력/출력 장치 선택
스트리밍 중 피치와 F0 실시간 조절
샘플 레이트, 청크 크기, 런타임 상태를 보는 Settings 모달
ONNX provider, PyTorch device, GPU, CUDA 상태 표시
모델 업로드, 활성화, 삭제를 한 화면에서 처리

스크린샷

메인 화면

설정 모달

빠른 시작

아래 명령은 Windows PowerShell 기준이며, 저장소 루트에서 실행합니다.

0. 저장소 클론

git clone https://github.com/sioaeko/OpenVoiceChanger.git
cd OpenVoiceChanger

1. 백엔드 설치

python -m venv .venv
.venv\Scripts\Activate.ps1
python -m pip install --upgrade pip
pip install -r backend/requirements.txt
pip install --no-deps git+https://github.com/RVC-Project/Retrieval-based-Voice-Conversion

2. 선택 사항: ONNX GPU 가속 활성화

기본 requirements.txt는 CPU용 ONNX Runtime을 설치합니다. 로컬 CUDA 가속을 쓰려면 CPU 패키지를 지우고 GPU 패키지로 교체합니다.

pip uninstall -y onnxruntime
pip install onnxruntime-gpu==1.23.2

3. 프론트엔드 설치

cd frontend
npm install
npm run build
cd ..

4. 모델 자산 준비

RVC .pth / .pt 모델을 쓰려면 HuBERT 콘텐츠 인코더 파일이 필요합니다.

New-Item -ItemType Directory -Force models\assets | Out-Null

파일 위치:

models/assets/hubert_base.pt

다른 위치를 쓰려면 OVC_HUBERT_PATH를 설정하면 됩니다.

5. 앱 실행

.venv\Scripts\python.exe -m uvicorn backend.main:app --host 127.0.0.1 --port 8000

브라우저에서 여세요:

http://127.0.0.1:8000

6. 선택 사항: Vite 개발 모드

터미널 1:

.venv\Scripts\python.exe -m uvicorn backend.main:app --reload --host 127.0.0.1 --port 8000

터미널 2:

cd frontend
npm run dev

그 다음 http://127.0.0.1:5173로 접속하면 됩니다.

모델 지원

형식	엔진	비고
`.onnx`	ONNX Runtime	기본은 CPU, `onnxruntime-gpu` 설치 시 CUDA 사용
`.pth` / `.pt`	PyTorch	RVC v1/v2, `hubert_base.pt` 필요

웹 UI 사용 순서

브라우저에서 앱을 엽니다.
Model Bay에 모델 파일을 업로드합니다.
사용할 모델에서 Activate를 누릅니다.
Settings를 열어 샘플 레이트, 청크 크기, 런타임 상태를 확인합니다.
입력 장치와 출력 장치를 고릅니다.
Start Routing을 누릅니다.
스트리밍 중 피치와 F0를 조절합니다.

API

메서드	엔드포인트	설명
`GET`	`/health`	헬스 체크
`GET`	`/api/config`	샘플 레이트, 청크 크기, ONNX 런타임 정보, PyTorch 런타임 정보
`GET`	`/api/models/`	업로드된 모델 목록
`POST`	`/api/models/upload`	모델 업로드
`DELETE`	`/api/models/{name}`	모델 삭제
`POST`	`/api/models/{name}/activate`	모델 활성화
`POST`	`/api/models/deactivate`	현재 모델 비활성화
`GET`	`/api/models/active`	현재 활성 모델 조회
`WS`	`/ws/audio`	실시간 오디오 스트리밍

백엔드 실행 중 /docs에서 Swagger UI를 볼 수 있습니다.

WebSocket 프로토콜

/ws/audio에 연결
JSON 설정 전송: {"sample_rate": 40000, "chunk_size": 4096}
바이너리 오디오 프레임 전송: [uint32 seq_num][uint32 reserved][float32[] PCM samples]
같은 형식으로 처리된 오디오 프레임 수신
필요할 때 설정 전송: {"pitch_shift": 3.0, "f0_method": "harvest"}

설정

환경 변수는 OVC_ 접두사를 사용합니다.

변수	기본값	설명
`OVC_MODELS_DIR`	`models`	모델 디렉토리
`OVC_HOST`	`0.0.0.0`	백엔드 바인드 주소
`OVC_PORT`	`8000`	백엔드 포트
`OVC_SAMPLE_RATE`	`40000`	기본 샘플 레이트
`OVC_CHUNK_SIZE`	`4096`	기본 청크 크기
`OVC_CORS_ORIGINS`	`["*"]`	허용 CORS origin
`OVC_LOG_LEVEL`	`info`	로그 레벨
`OVC_HUBERT_PATH`	`models/assets/hubert_base.pt`	RVC용 HuBERT 경로
`OVC_RMVPE_ROOT`	`models/assets/rmvpe`	선택적 RMVPE 자산 디렉토리
`OVC_RVC_STREAM_CONTEXT_SECONDS`	`1.0`	스트림별 RVC 문맥 길이
`OVC_RVC_INDEX_RATE`	`0.75`	매칭되는 `.index`가 있을 때 retrieval mix
`OVC_RVC_FILTER_RADIUS`	`3`	Harvest median filter 반경
`OVC_RVC_RMS_MIX_RATE`	`0.25`	RMS envelope blend
`OVC_RVC_PROTECT`	`0.33`	자음 보호 값

프로젝트 구조

OpenVoiceChanger/
├── backend/
│   ├── main.py
│   ├── config.py
│   ├── routers/
│   └── services/
├── frontend/
│   ├── public/
│   └── src/
├── models/
├── README.md
├── README_KR.md
├── README_JP.md
└── Makefile

Makefile

Makefile은 POSIX 셸 또는 WSL용 보조 도구입니다.

명령	설명
`make install`	백엔드와 프론트엔드 의존성 설치
`make dev`	백엔드와 프론트엔드 개발 서버 실행
`make dev-backend`	백엔드만 실행
`make dev-frontend`	프론트엔드만 실행
`make build`	프론트엔드 빌드
`make clean`	빌드 산출물 제거

요구 사항

Python 3.10+
Node.js 18+
npm

라이선스

MIT

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

OpenVoiceChanger

기능

스크린샷

메인 화면

설정 모달

빠른 시작

0. 저장소 클론

1. 백엔드 설치

2. 선택 사항: ONNX GPU 가속 활성화

3. 프론트엔드 설치

4. 모델 자산 준비

5. 앱 실행

6. 선택 사항: Vite 개발 모드

모델 지원

웹 UI 사용 순서

API

WebSocket 프로토콜

설정

프로젝트 구조

Makefile

요구 사항

라이선스

FilesExpand file tree

README_KR.md

Latest commit

History

README_KR.md

File metadata and controls

OpenVoiceChanger

기능

스크린샷

메인 화면

설정 모달

빠른 시작

0. 저장소 클론

1. 백엔드 설치

2. 선택 사항: ONNX GPU 가속 활성화

3. 프론트엔드 설치

4. 모델 자산 준비

5. 앱 실행

6. 선택 사항: Vite 개발 모드

모델 지원

웹 UI 사용 순서

API

WebSocket 프로토콜

설정

프로젝트 구조

Makefile

요구 사항

라이선스