RM 训练支持多模态模型吗 #7068
Unanswered
SakurajimaMaiii
asked this question in
Q&A
RM 训练支持多模态模型吗
#7068
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
使用 llamafactory 训练 RM, 微调
Qwen2-VL-7B-Instruct
发现保存的模型用
AutoModelForCausalLMWithValueHead.from_pretrained
加载会报如下的错误:上面给出的 config 和 qwen 有关的只有 Qwen2Config, Qwen2MoeConfig,
但是相同的代码, 换成文本数据,微调 Qwen2-7B-instruct,保存的模型就可以使用 AutoModelForCausalLMWithValueHead.from_pretrained 加载。
让我比较疑惑的是,训练是可以正常启动的,也就是说
上面的代码是可以正常运行的。
不知道有没有人尝试过训练多模态的 RM 模型。
另外想问下
llamafactory/model/model_utils/valuehead.py
下面的 prepare_valuehead_model 有用吗, 因为我看 trl 代码 trl/models/modeling_value_head.py 下面 AutoModelForCausalLMWithValueHead 的 forward 好像并不需要去改原来代码的 lm head 似乎就可以正常运行。Beta Was this translation helpful? Give feedback.
All reactions