-
Notifications
You must be signed in to change notification settings - Fork 640
Open
Labels
v100v100 related issuev100 related issue
Description
#1991 (comment) 问题跟这里类似,问一些比较短的问题能正常输出,但是问一些比较长的问题(超过1万字,不超过session-len里面设置的长度)结果返回空。
模型:qwen1.5-7b-chat
启动脚本:lmdeploy serve api_server qwen1half-7b-chat的模型路径 --server-name 0.0.0.0 --server-port 6002 --tp 1 --cache-max-entry-count 0.2 --rope-scaling-factor 0.2 --session-len 32000
日志报错:lmdeploy - ERROR - Truncate max_new_tokens to 19663
请问这是什么原因呢?
Metadata
Metadata
Assignees
Labels
v100v100 related issuev100 related issue