Skip to content

Feature Request: 集成 FunASR 实现语音输入和音频文件解析 #7030

@LauraGPT

Description

@LauraGPT

功能建议

FastGPT 是非常优秀的 AI 知识库平台。建议集成 FunASR 实现:

  1. 语音输入:用户通过语音与知识库对话
  2. 音频文件解析:将音频/视频文件转写为文本,纳入知识库

为什么选择 FunASR?

  • OpenAI 兼容 APIfunasr-server 提供 /v1/audio/transcriptions 接口,可直接对接
  • SenseVoice:超快 ASR(234M 参数),50+ 语种,中文识别精度极高
  • 说话人分离:识别"谁说了什么"——提升会议录音的检索精度
  • 时间戳:精准到字符级,支持定位音频片段
  • 私有部署:完全本地运行,符合 FastGPT 的部署理念

快速接入:

pip install funasr vllm fastapi uvicorn python-multipart
funasr-server --device cuda
# /v1/audio/transcriptions 接口就绪

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions