Transformer Transfomer复现 代码主要实现了下述功能: 大体复现了Transformer模型 训练了一个小的demo,demo的主要的功能如下: 学习的最终目标是使模型学会输出与输入的序列删除第一个字符之后的相同的序列,如输入[1,2,3,4,5],我们尝试让模型学会输出[2,3,4,5]。