关于数据集划分

您好！我看data_construct.py中是将原本数据集中的valid.txt切分获得验证集和测试集，这是否代表着LLM多学习了一些数据？
如果这样的话，对比structure-based KGE模型时，是否应该在更丰富的train.txt上训练呢？
或者说，LLM应该用原数据集中train.txt的部分数据微调，以保证公平性。