Skip to content

Panda-Panda-new/Computing-Large-Language-Models-Takes-Up-GPU-Memory

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 

Repository files navigation

2024年5月20日10:35:04

author : binghong Pan,


开发计算大语言模型中显存计算工具

1. 大模型参数计算公式

n-layer 模型层数
d-model 模型残差输出维度大小
d-ff 前馈神经网络输出维度大小
d-attn 注意力网络输出维度大小
n-heads 每一层的多头注意力的数量
n-ctx 输入的上下文长度大小

About

开发计算大语言模型训练/推理阶段占用GPU显存工具

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages