Skip to content

Releases: wujunwei928/GLM-ASR-WebUI

v0.0.2 - 项目重构与 UV 支持

18 Jan 07:29

Choose a tag to compare

🎉 GLM-ASR-WebUI v0.0.2

这是 GLM-ASR-WebUI 的第二个版本,主要带来项目结构现代化和开发工具升级。


✨ 主要更新

🏗️ 项目结构重构

  • 采用现代 Python 项目布局,核心代码移至 src/glm_asr/ 目录
  • 优化模块导入路径:from glm_asr.app import app
  • 提升代码组织性和可维护性

📦 UV 包管理器支持

  • 添加 pyproject.toml 项目配置文件
  • 集成 uv.lock 锁文件,确保依赖可复现
  • 提供 requirements.txt 导出脚本,兼容传统部署

🔧 开发体验改进

  • 配置 pre-commit 钩子,自动代码格式化和 lint 检查
  • 添加测试配置和基础测试框架
  • 添加 UV 迁移检查清单文档

🎨 WebUI 增强

  • 新增多主题系统(霓虹赛博朋克 / 简约明亮)
  • 修复移动端样式问题,提升响应式体验

🛠️ 安装升级

使用 UV(推荐)

# 安装 UV
pip install uv

# 克隆仓库
git clone https://github.com/wujunwei928/GLM-ASR-WebUI.git
cd GLM-ASR-WebUI

# 安装依赖
uv sync

# 启动服务
uv run uvicorn glm_asr.app:app --reload

使用 pip(兼容)

pip install -r requirements.txt
uvicorn glm_asr.app:app --reload

📝 API 变更

  • 模块导入路径变更:glm_asr.app 替代 app
  • API 端点保持不变,完全兼容 v0.0.1

🔗 链接


📄 许可证

Apache License 2.0

v0.0.1 - GLM-ASR-WebUI 初始版本

18 Jan 07:12

Choose a tag to compare

🎉 GLM-ASR-WebUI v0.0.1

这是 GLM-ASR-WebUI 的首个正式发布版本!

✨ 主要特性

  • 🎯 高精度识别: 采用 GLM-ASR-Nano-2512 模型,提供领先的语音识别能力
  • 🚀 流式 API: 长音频实时转录进度反馈
  • 🎨 赛博朋克 UI: 霓虹风格界面,配合动态粒子效果
  • 🎙️ 多种输入方式: 文件上传、URL 下载、实时录音
  • 📦 自动分块: 长音频自动分割处理(默认 30 秒/块)
  • GPU 加速: 支持 CUDA 推理加速

🛠️ 安装

前置要求

  • Python 3.12+
  • FFmpeg(用于音频时长检测和长音频分割)
  • CUDA GPU(可选,用于加速)

快速开始

```bash

克隆仓库

git clone https://github.com/wujunwei928/GLM-ASR-WebUI.git
cd GLM-ASR-WebUI

安装依赖

pip install -r requirements.txt

启动服务

uvicorn app:app --host 0.0.0.0 --port 8000
```

📡 API 端点

端点 方法 描述
/ GET Web 界面
/health GET 健康检查
/api/v1/transcribe POST 标准转录
/api/v1/transcribe-stream POST 流式转录(推荐)
/api/v1/model/info GET 模型信息
/docs GET API 文档

🔗 链接

📄 许可证

Apache License 2.0