how to run fnlp/moss-base-7b  in multi gpus

how to run fnlp/moss-base-7b  in multi gpus, i use this way:

from transformers import AutoTokenizer, AutoModelForCausalLM
**os.environ['CUDA_VISIBLE_DEVICES'] = "0,1"**
tokenizer = AutoTokenizer.from_pretrained("fnlp/moss-base-7b", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("fnlp/moss-base-7b", trust_remote_code=True).cuda()
model = model.eval()
inputs = tokenizer(["流浪地球的导演是"], return_tensors="pt")
for k,v in inputs.items():
    inputs[k] = v.cuda()
outputs = model.generate(**inputs, do_sample=True, temperature=0.8, top_p=0.8, repetition_penalty=1.1, max_new_tokens=256)
response = tokenizer.decode(outputs[0][inputs.input_ids.shape[1]:], skip_special_tokens=True)
print(response)

however it didn't use. Could you please give me some advice?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

how to run fnlp/moss-base-7b in multi gpus #369

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

how to run fnlp/moss-base-7b in multi gpus #369

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions