Skip to content

使用lmdeploy部署后模型返回空 #2006

@ChingKwanCheung

Description

@ChingKwanCheung

#1991 (comment) 问题跟这里类似,问一些比较短的问题能正常输出,但是问一些比较长的问题(超过1万字,不超过session-len里面设置的长度)结果返回空。
模型:qwen1.5-7b-chat
启动脚本:lmdeploy serve api_server qwen1half-7b-chat的模型路径 --server-name 0.0.0.0 --server-port 6002 --tp 1 --cache-max-entry-count 0.2 --rope-scaling-factor 0.2 --session-len 32000
日志报错:lmdeploy - ERROR - Truncate max_new_tokens to 19663
请问这是什么原因呢?

Metadata

Metadata

Assignees

Labels

v100v100 related issue

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions