您好!我看data_construct.py中是将原本数据集中的valid.txt切分获得验证集和测试集,这是否代表着LLM多学习了一些数据? 如果这样的话,对比structure-based KGE模型时,是否应该在更丰富的train.txt上训练呢? 或者说,LLM应该用原数据集中train.txt的部分数据微调,以保证公平性。
您好!我看data_construct.py中是将原本数据集中的valid.txt切分获得验证集和测试集,这是否代表着LLM多学习了一些数据?
如果这样的话,对比structure-based KGE模型时,是否应该在更丰富的train.txt上训练呢?
或者说,LLM应该用原数据集中train.txt的部分数据微调,以保证公平性。