Skip to content

关于数据集划分 #11

Description

@YinMingNLP

您好!我看data_construct.py中是将原本数据集中的valid.txt切分获得验证集和测试集,这是否代表着LLM多学习了一些数据?
如果这样的话,对比structure-based KGE模型时,是否应该在更丰富的train.txt上训练呢?
或者说,LLM应该用原数据集中train.txt的部分数据微调,以保证公平性。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Fields

    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions