Skip to content

internvl 2.5 8b 和qwen2.5vl的结果 #603

@yunzhuzhang0918

Description

@yunzhuzhang0918

经多次测试,发现internvl 2.5 8b的videomme,longvideobench_val_v和mlvu的结果与官方结果差异巨大,其中mlvu64帧结果只有57.89,比官方的60低了2个点。
qwen2.5vl 的videomme 结果只有62.9%,与官方的65.1差异巨大
测试时直接使用lmms eval跑的,什么也没有修改
建议lmms eval团队可以重新测试一下这些模型,看看是不是什么setting设置的不对?
期待回复

Metadata

Metadata

Assignees

No one assigned
    No fields configured for Feature.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions