Skip to content

Commit 75acaf6

Browse files
committed
[WeeklyReports]_2026_01.05-2026_01.18
1 parent 66ca41a commit 75acaf6

File tree

1 file changed

+21
-0
lines changed

1 file changed

+21
-0
lines changed
Lines changed: 21 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,21 @@
1+
### 姓名
2+
郑天宇
3+
4+
### 实习项目
5+
面向大模型训练的高效分布式checkpoint系统研究
6+
7+
### 本周工作
8+
9+
1. 在paddleformers中接入aoa_reverse组件
10+
2. 学习python的traceback逻辑,开发一套 AOATraceback 专门用于AOA解析与执行操作过程中的链式报错,为用户提供可追溯的报错信息
11+
3. 优化AOA的报错信息,同时新增load hf权重时的映射检查(key to safetenfors file)
12+
13+
14+
### 下周工作
15+
16+
1. Flex Checkpoint相关代码迁移到Paddlefleet库中,并在此基础上Refine。
17+
18+
### 导师评价
19+
20+
21+

0 commit comments

Comments
 (0)