使用ubert在gpu上训练,一共55w的训练集,但是每一轮epoch长达45小时,这应该不是正常现象吧
使用ubert在gpu上训练,一共55w的训练集,但是每一轮epoch长达45小时,这应该不是正常现象吧