Skip to content

ch3 关于无后效性的解释问题 #29

@Tipriest

Description

@Tipriest

2025年4月第一版
p19,倒数第二段:


原文:
无后效性指的是某个阶段状态一旦确定,就不受这个状态以后决策的影响。换句话说,某个状态之后的过程不会影响以前的状态,只与当前状态有关,这其实就是前面所说的马尔可夫性质。


问题:
什么是无后效性?
无后效性是动态规划能够成立的关键性质之一。它指的是:

“未来与过去无关”:一旦某个阶段的状态给定,那么在这个状态之后的过程演变,就不再受到这个状态之前阶段的影响。
“只看现在”:当我们在做当前阶段的决策时,我们只需要关心当前的状态是什么,而不需要关心我们是如何到达这个状态的。当前状态已经包含了所有对未来决策有用的信息。
总结一下就是某一阶段的状态一旦确定,后续过程的演变仅依赖于当前状态,而与如何到达该状态的路径无关。例如,在最短路径问题中,当前位置的后续决策仅取决于当前位置,而非之前的移动路径。


无后效性的关注点不是“当前状态”不受“未来决策”的影响(这在任何按时间顺序发展的系统中几乎都是必然的),而是未来的最优决策不受过去路径的影响。无后效性不强调“不影响以前的状态”,而是强调“未来的演化与历史路径无关”。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions