背景
当前兼容矩阵中,智谱 GLM 的 autocompact 标注为 —(未支持):
| 智谱 GLM / 阿里云百炼 | ⚠️ 实验兼容 | — | — | OpenAI Chat 兼容反代 |
实际场景
在使用 Codex Desktop + codex-app-transfer v2.1.14 + GLM-5.1 的场景中,飞书 MCP(@larksuiteoapi/lark-mcp)操作尤其容易消耗上下文:
飞书多维表格读写:单次工具调用 + 返回数据动辄数千 token
文档创建/编辑:内容 + 元数据占大量 context
长对话编码任务:多轮 apply_patch + 文件读取累积
当对话接近 160K token 上限时,Codex Desktop 触发 autocompact,但 GLM-5.1 无法正确处理压缩请求,导致:
对话卡死或返回格式错误
上下文丢失,需要开新对话重新开始
环境信息
codex-app-transfer: v2.1.14
模型: glm-5.1(智谱 coding paas endpoint)
Endpoint: https://open.bigmodel.cn/api/coding/paas/v4/chat/completions
apiFormat: openai_chat
context_window: 200000
auto_compact_token_limit: 160000
相关 Issue
DeepSeek 的 autocompact 已通过 prompt 简化和 quality check 修复(#224 ),GLM-5.1 作为同样走 openai_chat apiFormat 的 provider,理论上可以复用相同的 autocompact 适配层。
建议
对 GLM-5.1 启用 autocompact 流程,复用 fix(#219): autocompact prompt 简化 + quality check 通用化 + apply_patch 回归测试 #224 中简化的 compact prompt
真机测试 GLM-5.1 的压缩摘要质量(是否会出现 bug: autocompact 压缩机制在非 GPT 模型下失效 — DeepSeek 返回模板而非实际压缩内容 #219 中 DeepSeek 曾出现的「模板回显」问题)
如果 quality check 通过,在兼容矩阵中将 GLM 的 autocompact 从 — 升级为 ✅
用户反馈
作为实际用户,我愿意协助测试 GLM-5.1 autocompact 的真机验证。如有需要可以提供测试结果和日志。
背景
当前兼容矩阵中,智谱 GLM 的 autocompact 标注为
—(未支持):| 智谱 GLM / 阿里云百炼 |⚠️ 实验兼容 | — | — | OpenAI Chat 兼容反代 |
实际场景
在使用 Codex Desktop + codex-app-transfer v2.1.14 + GLM-5.1 的场景中,飞书 MCP(
@larksuiteoapi/lark-mcp)操作尤其容易消耗上下文:当对话接近 160K token 上限时,Codex Desktop 触发 autocompact,但 GLM-5.1 无法正确处理压缩请求,导致:
环境信息
https://open.bigmodel.cn/api/coding/paas/v4/chat/completionsopenai_chat相关 Issue
DeepSeek 的 autocompact 已通过 prompt 简化和 quality check 修复(#224),GLM-5.1 作为同样走
openai_chatapiFormat 的 provider,理论上可以复用相同的 autocompact 适配层。建议
—升级为✅用户反馈
作为实际用户,我愿意协助测试 GLM-5.1 autocompact 的真机验证。如有需要可以提供测试结果和日志。