Skip to content

功能建议:添加 SenseVoice 作为 ASR 引擎(中文识别更准,速度快 15 倍) #312

@LauraGPT

Description

@LauraGPT

功能建议

妙幕目前使用 Whisper 做语音识别,建议添加 SenseVoice 作为可选 ASR 引擎:

优势

  • 中文识别精度更高 — 专门针对中文优化
  • 速度快 15 倍 — 非自回归架构,234M 参数
  • 50+ 语种 — 支持中日英韩等
  • 内置 VAD — 无需额外配置静音检测
  • 情感检测 — 可识别说话人情绪
  • ONNX 部署 — 支持 CPU 端侧运行,通过 Sherpa-ONNX 跨平台部署

集成方式

pip install funasr

from funasr import AutoModel
model = AutoModel(model="iic/SenseVoiceSmall")
result = model.generate(input="audio.wav")

或使用 OpenAI 兼容 API:

funasr-server --device cuda
# POST /v1/audio/transcriptions

参考项目:

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions