请问提供的模型显存和内存需要多少呢? 我是否可以将仓库中提供的预训练模型换为更小的,比如说[Llama-2-7b](https://huggingface.co/meta-llama/Llama-2-7b)?