Skip to content

feat: 智谱 GLM-5.1 autocompact 支持 #248

@Deepwater1000

Description

@Deepwater1000

背景

当前兼容矩阵中,智谱 GLM 的 autocompact 标注为 (未支持):

| 智谱 GLM / 阿里云百炼 | ⚠️ 实验兼容 | — | — | OpenAI Chat 兼容反代 |

实际场景

在使用 Codex Desktop + codex-app-transfer v2.1.14 + GLM-5.1 的场景中,飞书 MCP(@larksuiteoapi/lark-mcp)操作尤其容易消耗上下文:

  • 飞书多维表格读写:单次工具调用 + 返回数据动辄数千 token
  • 文档创建/编辑:内容 + 元数据占大量 context
  • 长对话编码任务:多轮 apply_patch + 文件读取累积

当对话接近 160K token 上限时,Codex Desktop 触发 autocompact,但 GLM-5.1 无法正确处理压缩请求,导致:

  1. 对话卡死或返回格式错误
  2. 上下文丢失,需要开新对话重新开始

环境信息

  • codex-app-transfer: v2.1.14
  • 模型: glm-5.1(智谱 coding paas endpoint)
  • Endpoint: https://open.bigmodel.cn/api/coding/paas/v4/chat/completions
  • apiFormat: openai_chat
  • context_window: 200000
  • auto_compact_token_limit: 160000

相关 Issue

DeepSeek 的 autocompact 已通过 prompt 简化和 quality check 修复(#224),GLM-5.1 作为同样走 openai_chat apiFormat 的 provider,理论上可以复用相同的 autocompact 适配层。

建议

  1. 对 GLM-5.1 启用 autocompact 流程,复用 fix(#219): autocompact prompt 简化 + quality check 通用化 + apply_patch 回归测试 #224 中简化的 compact prompt
  2. 真机测试 GLM-5.1 的压缩摘要质量(是否会出现 bug: autocompact 压缩机制在非 GPT 模型下失效 — DeepSeek 返回模板而非实际压缩内容 #219 中 DeepSeek 曾出现的「模板回显」问题)
  3. 如果 quality check 通过,在兼容矩阵中将 GLM 的 autocompact 从 升级为

用户反馈

作为实际用户,我愿意协助测试 GLM-5.1 autocompact 的真机验证。如有需要可以提供测试结果和日志。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions