Releases: wujunwei928/GLM-ASR-WebUI
Releases · wujunwei928/GLM-ASR-WebUI
v0.0.2 - 项目重构与 UV 支持
🎉 GLM-ASR-WebUI v0.0.2
这是 GLM-ASR-WebUI 的第二个版本,主要带来项目结构现代化和开发工具升级。
✨ 主要更新
🏗️ 项目结构重构
- 采用现代 Python 项目布局,核心代码移至
src/glm_asr/目录 - 优化模块导入路径:
from glm_asr.app import app - 提升代码组织性和可维护性
📦 UV 包管理器支持
- 添加
pyproject.toml项目配置文件 - 集成
uv.lock锁文件,确保依赖可复现 - 提供
requirements.txt导出脚本,兼容传统部署
🔧 开发体验改进
- 配置 pre-commit 钩子,自动代码格式化和 lint 检查
- 添加测试配置和基础测试框架
- 添加 UV 迁移检查清单文档
🎨 WebUI 增强
- 新增多主题系统(霓虹赛博朋克 / 简约明亮)
- 修复移动端样式问题,提升响应式体验
🛠️ 安装升级
使用 UV(推荐)
# 安装 UV
pip install uv
# 克隆仓库
git clone https://github.com/wujunwei928/GLM-ASR-WebUI.git
cd GLM-ASR-WebUI
# 安装依赖
uv sync
# 启动服务
uv run uvicorn glm_asr.app:app --reload使用 pip(兼容)
pip install -r requirements.txt
uvicorn glm_asr.app:app --reload📝 API 变更
- 模块导入路径变更:
glm_asr.app替代app - API 端点保持不变,完全兼容 v0.0.1
🔗 链接
📄 许可证
Apache License 2.0
v0.0.1 - GLM-ASR-WebUI 初始版本
🎉 GLM-ASR-WebUI v0.0.1
这是 GLM-ASR-WebUI 的首个正式发布版本!
✨ 主要特性
- 🎯 高精度识别: 采用 GLM-ASR-Nano-2512 模型,提供领先的语音识别能力
- 🚀 流式 API: 长音频实时转录进度反馈
- 🎨 赛博朋克 UI: 霓虹风格界面,配合动态粒子效果
- 🎙️ 多种输入方式: 文件上传、URL 下载、实时录音
- 📦 自动分块: 长音频自动分割处理(默认 30 秒/块)
- ⚡ GPU 加速: 支持 CUDA 推理加速
🛠️ 安装
前置要求
- Python 3.12+
- FFmpeg(用于音频时长检测和长音频分割)
- CUDA GPU(可选,用于加速)
快速开始
```bash
克隆仓库
git clone https://github.com/wujunwei928/GLM-ASR-WebUI.git
cd GLM-ASR-WebUI
安装依赖
pip install -r requirements.txt
启动服务
uvicorn app:app --host 0.0.0.0 --port 8000
```
📡 API 端点
| 端点 | 方法 | 描述 |
|---|---|---|
/ |
GET | Web 界面 |
/health |
GET | 健康检查 |
/api/v1/transcribe |
POST | 标准转录 |
/api/v1/transcribe-stream |
POST | 流式转录(推荐) |
/api/v1/model/info |
GET | 模型信息 |
/docs |
GET | API 文档 |
🔗 链接
📄 许可证
Apache License 2.0