| name | distill-shield | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| description | Distill Shield:为个人移交资料包生成 Canary 与可选加固策略,提高未授权蒸馏成本;仅适用于有权处置的数据。 | |||||||||
| license | MIT | |||||||||
| metadata |
|
- 本 Skill 唯一入口:当前文件
distill-shield-skill/SKILL.md。 - 仓库根:假定
immortal-skill/(或含本目录与kit/的克隆根)。 - 从仓库根运行生成脚本(推荐,避免路径歧义):
python3 distill-shield-skill/kit/shield_gen.py --output ./handover-bundle --label "我的移交包"- 聚合入口:
FOR_AI.md第三节。
根据用户第一条消息的语言,全程使用同一语言。
- 用户要「防蒸馏」「加固资料包」「移交前埋 Canary」。
- 用户运行
kit/shield_gen.py后需要根据输出做伦理与可读性检查。
- 仅对本人或已获授权的数据使用;禁止对他人资料恶意投毒。
- 不承诺数学上不可攻破;承诺 可检测性、审计成本、部分管线干扰。
- 本 Skill 根目录
{baseDir}=distill-shield-skill/。
- 蒸馏场景:一次性 LLM 蒸馏 vs 批量训练 vs 仅人类阅读?
- 接收方:家人 / 律师 / 公司?(决定策略强度)
- 格式、是否分块检索、是否经 OCR。
| 策略 | 对人 | 对自动化管线 | 可被绕过 |
|---|---|---|---|
| Canary 唯一字符串 | 低影响(可放附录) | 泄露时可检索 | 剔除后丢失 |
| 提示注入段 | 需标注阅读区 | 可能干扰单次 LLM 蒸馏 | 预处理可剥离 |
| 矛盾样本 | 可能困惑读者 | 污染蒸馏一致性 | 人工可识别 |
在 distill-shield-skill/ 目录内时:
python3 kit/shield_gen.py --output ./handover-bundle --label "我的移交包"在 仓库根(推荐,与「复制给 AI」一致):
python3 distill-shield-skill/kit/shield_gen.py --output ./handover-bundle --label "我的移交包"将生成的 CANARY.txt 与说明合并进实际交付目录。
- 第三方隐私已脱敏
- Canary 已记录在安全处(便于日后比对)
- 人类读者能看懂「附录为技术性标记」
解释「附录含技术性标记,用于完整性校验,非正文内容」。
- 不提供针对具体模型的对抗样本保证。
- 不帮助绕过合法安全控制。