docs(agents): add escalation-boundary guidance for sonnet-ceiling agents#742
Merged
Conversation
code-reviewer, codebase-analyzer, and test-strategist can hit the sonnet ceiling on deep security, cyclic-dependency, and audit-grade reasoning. Add an Escalation section to each body in both layers instead of changing the model field: code-reviewer routes Critical security findings to the security-audit skill; all three note the caller may override model: opus for large monorepos or audit-grade work. model fields are unchanged.
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
변경 내용
sonnet 모델 천장에 닿을 수 있는 3개 에이전트(
code-reviewer,codebase-analyzer,test-strategist) 본문에## Escalation섹션을 추가했다(plugin/+project/두 레이어, 총 6개 파일).model필드는 변경하지 않았다.배경
감사 결과 이 3개 에이전트는 깊은 보안(다단계 인젝션 체인 등)·순환 의존성 추적·audit-grade 커버리지 종합에서 sonnet 추론 천장에 닿을 수 있다. 그러나
model을 opus로 상향하는 것은 비용 대비 이득이 불명확하다. 따라서 모델 값을 바꾸는 대신 에스컬레이션 경계를 본문에 명문화하는 보수적 방식을 택했다.구현
code-reviewer: 심각도 높은 보안 발견은 1차 스크리닝으로 보고security-audit스킬로 에스컬레이션하도록 명시(이 에이전트를 보안 게이트의 최종 권위로 쓰지 않음) + 대규모/audit-grade 시 호출 측model: opusoverride 안내.codebase-analyzer: 대규모 모노레포·순환 의존성 추적 시 호출 측model: opusoverride 안내 + confidence 점수 보고로 에스컬레이션 판단 지원.test-strategist: 대형 테스트 스위트·audit-grade 커버리지 분석 시 호출 측model: opusoverride 안내.## Reporting섹션 바로 앞에 삽입, plugin/project 동일 텍스트로 parity 유지.검증
grep "## Escalation"→ 대상 6개 파일만 매칭(나머지 10개 미변경)grep "^model:"→ 6개 파일 모두model: sonnet그대로(필드 불변)scripts/check_agents.sh→OK (8 agent pairs: bodies + behavioral frontmatter in sync)(#738에서 추가된 frontmatter parity 게이트 포함 통과)비고
적대적 검토 반영: 모델 상향이 아닌 운영 가이드 추가(런타임 동작 불변)로, evidence 없는 비용 증가를 회피했다.
Closes #739
Part of #726