功能建议
妙幕目前使用 Whisper 做语音识别,建议添加 SenseVoice 作为可选 ASR 引擎:
优势:
- 中文识别精度更高 — 专门针对中文优化
- 速度快 15 倍 — 非自回归架构,234M 参数
- 50+ 语种 — 支持中日英韩等
- 内置 VAD — 无需额外配置静音检测
- 情感检测 — 可识别说话人情绪
- ONNX 部署 — 支持 CPU 端侧运行,通过 Sherpa-ONNX 跨平台部署
集成方式:
pip install funasr
from funasr import AutoModel
model = AutoModel(model="iic/SenseVoiceSmall")
result = model.generate(input="audio.wav")
或使用 OpenAI 兼容 API:
funasr-server --device cuda
# POST /v1/audio/transcriptions
参考项目:
功能建议
妙幕目前使用 Whisper 做语音识别,建议添加 SenseVoice 作为可选 ASR 引擎:
优势:
集成方式:
或使用 OpenAI 兼容 API:
funasr-server --device cuda # POST /v1/audio/transcriptions参考项目: