在做上下文压缩时,我看到许多主流agent,比如claude code都提到隐藏工具调用结果、删除无用信息、压缩历史信息等方式。 问题一:这样是否会导致prompt cache问题呢?上下文变了,缓存命中降低,岂不是更增加成本呢? 问题二:如果是一个很长的文章/工具调用结果,我们直接截断放到硬盘里保存,那我们下次调用时再去打开这个保存的文件,那不还是需要加载进来吗? 期待有大佬可以解答
在做上下文压缩时,我看到许多主流agent,比如claude code都提到隐藏工具调用结果、删除无用信息、压缩历史信息等方式。
问题一:这样是否会导致prompt cache问题呢?上下文变了,缓存命中降低,岂不是更增加成本呢?
问题二:如果是一个很长的文章/工具调用结果,我们直接截断放到硬盘里保存,那我们下次调用时再去打开这个保存的文件,那不还是需要加载进来吗?
期待有大佬可以解答