Skip to content

Commit 279ce41

Browse files
authored
[WeeklyReport] zerorains 2025.5.17~2025.6.15 (#490)
1 parent b752fd5 commit 279ce41

File tree

1 file changed

+38
-0
lines changed

1 file changed

+38
-0
lines changed
Lines changed: 38 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,38 @@
1+
### 姓名
2+
3+
卢林军
4+
5+
### 实习项目
6+
7+
大语言模型推理&服务化易用性提升专项
8+
9+
### 本周工作
10+
11+
本项目的主要工作是优化当前PaddleNLP大模型推理服务调用,本周主要工作如下:
12+
13+
1. 使fastsafetensors支持paddle
14+
15+
了解fastsafetensors的基本工作流程,目前已支持paddle在single模式下的Tensor加载,分布式加载(parallel)已经支持了cpu+gloo后端的加载,gpu+nccl后端的加载仍然存在一些问题,后续会继续进行分析。
16+
通过替换torch API以及添加必要的cpp函数,已经实现了fastsafetensors对paddle的支持。
17+
18+
修复UIN16数据类型的模型加载。使用bfloat16的Tensor接收数据
19+
20+
修复多卡GPU并行加载Tensor的BUG。实现基于rank的device设置
21+
22+
修复分布式场景下Tensor加载异常的问题。将broadcast和scatter改为同步OP。
23+
24+
相关仓库:
25+
26+
- https://github.com/foundation-model-stack/fastsafetensors/pull/16
27+
- https://github.com/foundation-model-stack/fastsafetensors/pull/19
28+
- https://github.com/foundation-model-stack/fastsafetensors/pull/22
29+
30+
31+
### 下周工作
32+
33+
1. 跟进fastsafetensors的torch和paddle依赖分离的PR
34+
35+
### 导师点评
36+
37+
38+

0 commit comments

Comments
 (0)