 不管英文还是中文数据训练,都出现空格,并且推理信息很少,跟你发布的模型差异很大。 只使用了LLava的数据,没使用另外两个。训练了1个epoch,loss在2.6左右。