File tree Expand file tree Collapse file tree 1 file changed +38
-0
lines changed
WeeklyReports/Hackathon_8th/07_zeroRains Expand file tree Collapse file tree 1 file changed +38
-0
lines changed Original file line number Diff line number Diff line change 1+ ### 姓名
2+
3+ 卢林军
4+
5+ ### 实习项目
6+
7+ 大语言模型推理&服务化易用性提升专项
8+
9+ ### 本周工作
10+
11+ 本项目的主要工作是优化当前PaddleNLP大模型推理服务调用,本周主要工作如下:
12+
13+ 1 . 使fastsafetensors支持paddle
14+
15+ 了解fastsafetensors的基本工作流程,目前已支持paddle在single模式下的Tensor加载,分布式加载(parallel)已经支持了cpu+gloo后端的加载,gpu+nccl后端的加载仍然存在一些问题,后续会继续进行分析。
16+ 通过替换torch API以及添加必要的cpp函数,已经实现了fastsafetensors对paddle的支持。
17+
18+ 修复UIN16数据类型的模型加载。使用bfloat16的Tensor接收数据
19+
20+ 修复多卡GPU并行加载Tensor的BUG。实现基于rank的device设置
21+
22+ 修复分布式场景下Tensor加载异常的问题。将broadcast和scatter改为同步OP。
23+
24+ 相关仓库:
25+
26+ - https://github.com/foundation-model-stack/fastsafetensors/pull/16
27+ - https://github.com/foundation-model-stack/fastsafetensors/pull/19
28+ - https://github.com/foundation-model-stack/fastsafetensors/pull/22
29+
30+
31+ ### 下周工作
32+
33+ 1 . 跟进fastsafetensors的torch和paddle依赖分离的PR
34+
35+ ### 导师点评
36+
37+
38+
You can’t perform that action at this time.
0 commit comments