-
Notifications
You must be signed in to change notification settings - Fork 32
Open
Description
2025年4月第一版
p19,倒数第二段:
原文:
无后效性指的是某个阶段状态一旦确定,就不受这个状态以后决策的影响。换句话说,某个状态之后的过程不会影响以前的状态,只与当前状态有关,这其实就是前面所说的马尔可夫性质。
问题:
什么是无后效性?
无后效性是动态规划能够成立的关键性质之一。它指的是:
“未来与过去无关”:一旦某个阶段的状态给定,那么在这个状态之后的过程演变,就不再受到这个状态之前阶段的影响。
“只看现在”:当我们在做当前阶段的决策时,我们只需要关心当前的状态是什么,而不需要关心我们是如何到达这个状态的。当前状态已经包含了所有对未来决策有用的信息。
总结一下就是某一阶段的状态一旦确定,后续过程的演变仅依赖于当前状态,而与如何到达该状态的路径无关。例如,在最短路径问题中,当前位置的后续决策仅取决于当前位置,而非之前的移动路径。
无后效性的关注点不是“当前状态”不受“未来决策”的影响(这在任何按时间顺序发展的系统中几乎都是必然的),而是未来的最优决策不受过去路径的影响。无后效性不强调“不影响以前的状态”,而是强调“未来的演化与历史路径无关”。
Metadata
Metadata
Assignees
Labels
No labels