比如在autocbt场景中,咨询师要么选择向督导师发起对话,要么向咨询者发起对话,而不应该同时向督导师和咨询者发起对话。由于LLM的Instruction Following的问题,即使在prompt指定上述的对话逻辑,咨询师的通讯对象依旧容易同时出现咨询者和督导师。