We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
解答: 先对输入和标签进行设备(device)变换和形状(reshape)变换,再进行前向计算和反向传播,将隐状态的分离操作放在更新之前,避免了更新中对隐状态进行计算,这样无需对隐状态进行修改,即可实现了不会从计算图中分离隐状态。
但是给出的解答代码里并没有与分离梯度相关的detach_()函数
Activity