Skip to content

Latest commit

 

History

History
541 lines (336 loc) · 15.8 KB

File metadata and controls

541 lines (336 loc) · 15.8 KB

Vibe Coding 哲学方法论提效工具箱(Python)

目标:把"vibe(探索)"系统化为"可验证、可迭代、可收敛"的工程产出。 每个方法给出:用途 / 落地动作 / Python工具 / 可复制提示词。

目录


总体作业流

建议默认流程:

  1. 现象卡片(现象/意图/情境/边界)→ 清零脑补
  2. 规格化(类型+schema+错误语义+不变式)→ 可机器检查
  3. 检查器(单测+性质测试+lint+类型检查+关键断言)→ 可证伪
  4. 最小实现(main path)→ 快速跑通
  5. 反例驱动(Hypothesis/边界/差分/基准)→ 找到失败模式
  6. 收敛重构(删复杂度、固化概念、稳定接口、补文档)→ 可维护

推荐底座(Python)

ruff + black + pyright(或 mypy) + pytest + hypothesis + pydantic(msgspec可替代)

方法论

1. 现象学还原(悬置假设)

用途:需求含糊、模型脑补、Bug难复现时,先把"解释/偏好"清零,回到可观察事实与可复现结构。

落地动作

  • 先写四件套:现象(实际) / 意图(期望) / 情境(环境约束) / 边界(明确不做)
  • 输出最小可复现体 MRE:最小输入 + 最小脚本 + 复现步骤 + 预期vs实际
  • 把抽象词降维:快/稳/好用 → 指标&验收用例

Python工具pytest(MRE脚本)、日志、最小数据样例

提示词

先做现象学还原:不要推测原因。输出:现象/意图/情境/边界/未确定项/MRE;然后再给最小修复与测试。

2. 正反合(三段迭代)

用途:把一次性"写到完美"替换为可控三轮:快速可用 → 反例打脸 → 收敛为工程版本。

落地动作

  • :只做 main path,让它跑通
  • :列失败模式(边界/空值/并发/权限/超时/性能),用测试与基准逼出反例
  • :重构接口/收敛依赖/补文档与回归,形成下一轮稳定起点

Python工具pytest + hypothesis + ruff/black + profiling/benchmark

提示词

按正反合输出:1)最小可运行实现 2)反例与失败模式+测试 3)综合后的重构方案与最终代码。

3. 可证伪主义(波普尔)

用途:把"看起来对"变成"暂时无法证伪";显著降低隐藏 bug。

落地动作

  • 每个关键断言都要配一个能让它失败的测试(边界/随机/反例)
  • 优先性质测试而非只写示例测试

Python工具hypothesis(性质/模糊)、pytest

提示词

为该实现列出 5 个可证伪点,并为每个点写一个最小测试(优先 Hypothesis 性质测试)。

4. 形式化方法(轻量形式化)

用途:减少非法状态、约束模型输出、让行为可检查可累积。

落地动作

  • 先规格:类型 + schema + 不变式 + 错误集合(异常或 error object)+ 复杂度约束(可选)
  • 再检查器:类型检查 + 运行时校验 + 断言/契约 + 性质测试
  • 最后实现:逐条映射规格(谁保证哪条约束)

Python工具

  • typing(Literal/NewType/Protocol/TypedDict/Annotated)
  • pyright/mypy
  • pydantic/msgspec(输入输出校验)
  • assert / icontract / deal
  • pytest + hypothesis

提示词

先输出形式化规格(类型/schema/不变式/错误语义),再给至少 3 条 Hypothesis 性质测试,最后写实现并逐条说明满足关系。

5. 奥卡姆剃刀(最小复杂度)

用途:避免模型引入不必要框架/抽象;提升可维护性与迭代速度。

落地动作

  • 要求两套方案:常规版 vs 简化版;以测试为准删复杂度
  • 优先标准库、减少依赖、减少可变状态、减少层级

Python工具ruff(复杂度/风格)、依赖审计(requirements最小化)

提示词

在满足全部测试与验收的前提下,把实现复杂度删掉 30%:减少依赖、状态和抽象层,并解释删减理由。

6. 实用主义(以指标为准)

用途:避免"优化方向漂移";每轮明确一个可量化目标。

落地动作

  • 先定义成功指标(P95延迟/错误率/成本/内存/可维护性)
  • 每轮只优化一个指标;其余保持不退化(用基准/回归锁住)

Python工具pytest-benchmark 或简单计时;日志与指标;回归测试

提示词

把需求转成指标与验收阈值,并给出测量方法;本轮只优化 X 指标,保证其它指标不退化。

7. 系统论/整体论(边界与反馈回路)

用途:复杂系统容易在耦合点失控;缩短反馈回路提效最大。

落地动作

  • 先画数据流/依赖边界:I/O 放边缘,核心逻辑保持纯函数
  • 优先解耦高耦合点;把慢依赖换成桩/模拟以加速测试

Python工具:依赖注入(轻量)、pytest fixtures、纯函数设计

提示词

画出数据流与依赖边界,指出最高耦合点与最短反馈回路改造方案;给出可测试的纯函数核心与 I/O 适配层。

8. 诠释学(语境澄清)

用途:需求文本有歧义,模型与人对同一词理解不同。

落地动作

  • 先复述需求 + 歧义清单 + 默认选择(必须显式)
  • 默认选择写入 docstring/README/类型定义

Python工具:docstring、类型与 schema 固化默认

提示词

先复述需求并列出所有歧义点;对每个歧义给默认策略与理由;确认后再写实现与测试。

9. "钢人化"原则(最强版本理解)

用途:减少无效争论/误解;让重构建议更贴近原意图。

落地动作

  • 先把现有方案表达成最强版本(目标、约束、权衡)
  • 再提出改进(保留其优势,指出代价)

Python工具:PR描述结构化(优点/风险/替代方案)

提示词

先钢人化现有实现:列出它的最佳解释与优点;再给改进方案并明确代价与风险。

10. 决策论/机会成本(可逆优先)

用途:避免过早做不可逆技术决策(换框架/改数据模型)。

落地动作

  • 标注决策:可逆 vs 不可逆;优先做可逆高价值项
  • 先写接口+测试桩+适配层,延后绑定外部系统

Python工具:抽象边界、adapter、in-memory 实现

提示词

把方案拆成可逆/不可逆决策;先给可逆路径的 MVP,实现通过测试;不可逆部分只给接口与占位实现。

11. 反事实推理(Counterfactuals)

用途:系统性覆盖异常路径,降低线上事故。

落地动作

  • 问"如果 X 不成立会怎样":超时、乱序、重复、空值、弱网、权限缺失、时钟漂移
  • 把反事实转成测试矩阵与降级策略

Python工具pytest 参数化、hypothesis 生成器、超时与重试控制

提示词

列出 15 个反事实场景并按风险排序;为 Top5 写测试与降级/错误语义。

12. 溯因推理(Abduction,最佳解释)

用途:debug/性能退化时,比穷举更快定位"最可能原因"。

落地动作

  • 列候选原因 → 为每个原因写最便宜的区分性实验(日志点/开关/最小基准)
  • 用证据淘汰而不是凭感觉改代码

Python工具:结构化日志、trace、最小 benchmark、feature flag

提示词

给出候选原因列表,并为每个原因提供一个最低成本、最高区分度的验证实验与预期观察。

13. 贝叶斯式信念更新(与溯因配合)

用途:在不确定下理性分配排查时间。

落地动作

  • 给假设先验(高/中/低)→ 实验后更新后验排序
  • 只对后验最高的 1-2 个假设投入修改成本

Python工具:同 12;加一张"假设-证据"表

提示词

按先验排序原因;给最信息增益实验;根据可能结果更新排序并给下一步。

14. 反思平衡(Reflective equilibrium)

用途:当用例、原则、约束冲突时收敛规范(尤其 API 语义、错误处理、兼容性)。

落地动作

  • 三层对齐:具体用例 ↔ 一般原则 ↔ 系统约束
  • 用测试固化:回归用例(具体判断)+ 性质测试(原则)

Python工具pytest + hypothesis;规范文档(错误模型/幂等语义)

提示词

列出用例/原则/约束三集,指出冲突点;给两轮调整方案,每轮说明要改哪些用例、原则或实现以达成一致。

15. 概念分析 / 概念工程

用途:防止术语漂移导致返工;把领域概念固化进代码。

落地动作

  • 概念表:术语/定义/边界/不变量/转换关系
  • 概念工程:用 Enum/Literal/NewType/dataclass(frozen) 与 schema 固化边界;禁止混用

Python工具EnumLiteralNewTypepydantic 校验

提示词

先产出概念表;再映射成 Python 类型与 schema;给 5 个应被拒绝的反例输入,并写对应测试。

16. 方法论怀疑(笛卡尔式)

用途:把不可靠前提当事实是 vibe coding 常见事故源。

落地动作

  • 对关键前提标注:是否可验证
  • 不可验证 → 必须加运行时校验/超时/重试/降级;并写会失败的测试

Python工具assert/校验器、超时、重试、容错分支测试

提示词

列出该方案依赖的所有前提,并标注可验证性;对不可验证前提添加防线(校验/超时/降级)与对应测试。

17. 视角三角测量(Triangulation)

用途:减少单一证据的误判;提升结论可靠性。

落地动作

  • 同一结论至少两种证据:单测/性质测试 + 日志/指标;或差分测试 + fuzz

Python工具pytest/hypothesis + metrics/logging;差分对照

提示词

对关键行为给出至少两种独立验证方式,并说明各自盲区与如何互补。

18. 机制解释(Mechanistic explanation)

用途:把"能跑"变成"可解释可维护";降低未来修改风险。

落地动作

  • 要求输出数据流:输入 → 中间状态 → 输出
  • 对中间状态写不变式/断言;把解释与代码结构对齐

Python工具assert、类型收窄、分层函数、docstring

提示词

给出机制解释:数据在系统中如何流动;列出每个中间状态的不变式,并在代码中用断言或类型保证。

19. 错误认识论(Error epistemology)

用途:系统化"我们会如何错",比事后补洞更省。

落地动作

  • 先做失败模式清单(空值/乱序/重复/并发/权限/超时/编码/浮点等)
  • 每类至少一个测试;明确错误语义(raise / error object / log+metric)

Python工具pytest 参数化 + hypothesis;统一 error 模型

提示词

生成失败模式清单并按风险排序;为 Top N 写测试;统一错误模型并给出示例响应/异常层级。

20. 实验哲学(x-phi)

用途:交互与默认策略别靠直觉,用数据决定。

落地动作

  • 把争议点改成可测实验(A/B 默认值、错误文案、重试策略)
  • 指标:误用率、重试率、成功率、工单率、完成时间

Python工具:埋点/日志、简单 A/B 分组、配置开关

提示词

把该设计争议转成实验:分组、指标、样本、持续时间、判定阈值;给出埋点字段与分析方法。

21. 计算哲学(Computational philosophy)

用途:复杂状态与规则用"可运行模型/仿真/搜索"代替纯讨论。

落地动作

  • reference 实现(慢但清晰)作为 oracle
  • optimized 实现(快/工程化)用差分测试锁死行为
  • 用仿真/生成器自动探索边界

Python工具hypothesis、差分测试、状态机测试(Hypothesis stateful)

提示词

先写 reference(清晰)+ optimized(高效);写差分测试与状态机/性质测试自动找反例并修复。

22. 自然化认识论(Naturalized epistemology)

用途:承认人类/模型都有系统性偏误,用流程与工具把偏误外包给检查器。

落地动作

  • 默认自动化:lint+format+类型检查+测试
  • 高风险路径:必须性质测试/模糊测试/运行时校验
  • 结论至少双证据(测试+指标)

Python工具ruff/black/pyright/pytest/hypothesis/pydantic

提示词

列出该任务最常见的误判点,并为每个误判点给一个自动化防线(检查器/测试/断言/埋点)。

23. 贝叶斯认识论(Bayesian epistemology)

用途:在多个方案/原因间理性分配注意力与试错预算。

落地动作

  • 先验 → 实验 → 后验 → 下一步;把排查变成序列决策问题

Python工具:同 12/13;记录表

提示词

用贝叶斯式流程组织排查:先验排序、信息增益最高的实验、更新后的行动计划。

附录

通用"性质测试"提示(可复用)

性质 说明
非负性/有界性 结果不越界
幂等性 f(f(x)) == f(x)
单调性 输入增大输出不违反预期
守恒性 长度/集合元素/总和按规则变化
互逆性 decode(encode(x)) == x(或近似)
稳定性 排序/去重等操作满足稳定条件
交换/结合 满足代数性质的操作应通过

建议的项目骨架(最小)

src/           # 纯逻辑与 I/O 分离
tests/         # 示例+性质+差分
pyproject.toml # ruff/pytest/pyright
README.md      # 概念表/错误语义/验收指标

使用指南

场景 推荐方法组合
需求不清 1(现象学)+ 8(诠释学)+ 15(概念工程)
质量不稳 3(可证伪)+ 4(形式化)+ 19(错误认识论)
排错提效 12(溯因)+ 13/23(贝叶斯更新)+ 17(三角测量)
复杂系统 7(系统论)+ 21(计算哲学)+ 14(反思平衡)
交互默认争议 20(x-phi)+ 6(实用主义指标)