在单个模型对多个partitioned数据集做eval的时候,模型会被重复加载 #1088
Unanswered
IcyFeather233
asked this question in
Q&A
Replies: 1 comment
-
oc设计上是这样的,这种方式更有利于抢占集群的资源。如果你对MTBench这种比较小的数据集想要不切分的话,我建议用这个config: https://github.com/open-compass/opencompass/blob/main/configs/datasets/subjective/multiround/mtbench_single_judge.py 他只会启动一个任务,这是因为原版的mtbench他根据题目类型划分成了三种不同温度的设定,也就是不同的子数据集需要用不同的温度来推理,所以为了和原版保持一致我们也做了这样的划分。但是实际上我们实测下来即使都设成同一温度也没有多少影响(这一点在最新的arenahard上也使用了统一的温度),比不上mtbench本身的bias,所以你可以直接用统一温度的config推理,这样就不会切分了。 By the way,arenahard数据集我们也支持完了,很快会提pr |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
例如这样的配置:
MTBench数据集被切成了三个task,运行发现每次运行一个task,都会重复加载模型,造成时间上的浪费:
但是我没完全看懂代码,找不到在哪里修改TAT 不过我觉得这个问题应该被修复掉
Beta Was this translation helpful? Give feedback.
All reactions