Feature Request: 集成 FunASR 实现语音输入和音频文件解析

## 功能建议

FastGPT 是非常优秀的 AI 知识库平台。建议集成 FunASR 实现：
1. **语音输入**：用户通过语音与知识库对话
2. **音频文件解析**：将音频/视频文件转写为文本，纳入知识库

**为什么选择 FunASR？**

- **OpenAI 兼容 API**：`funasr-server` 提供 `/v1/audio/transcriptions` 接口，可直接对接
- **SenseVoice**：超快 ASR（234M 参数），50+ 语种，中文识别精度极高
- **说话人分离**：识别"谁说了什么"——提升会议录音的检索精度
- **时间戳**：精准到字符级，支持定位音频片段
- **私有部署**：完全本地运行，符合 FastGPT 的部署理念

**快速接入：**
```bash
pip install funasr vllm fastapi uvicorn python-multipart
funasr-server --device cuda
# /v1/audio/transcriptions 接口就绪
```

- GitHub: https://github.com/modelscope/FunASR（16K+ stars）
- SenseVoice: https://github.com/FunAudioLLM/SenseVoice（8K+ stars）

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Feature Request: 集成 FunASR 实现语音输入和音频文件解析 #7030

功能建议

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Feature Request: 集成 FunASR 实现语音输入和音频文件解析 #7030

Description

功能建议

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions