Skip to content

Commit c682d3b

Browse files
committed
[WeeklyReports]_2025_10.20-2025_11.09
1 parent 2796f8e commit c682d3b

File tree

1 file changed

+35
-0
lines changed

1 file changed

+35
-0
lines changed
Lines changed: 35 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,35 @@
1+
### 姓名
2+
郑天宇
3+
4+
### 实习项目
5+
自动并行流水并行功能增强和性能优化
6+
7+
### 本周工作
8+
9+
**aoa相关组件问题(PR均已合入)**
10+
- 1.修复add,remove的bug,同时为aoa添加add、cast等单测
11+
- 2.修复star_macro的在匹配字符串的逻辑,转换成严格匹配
12+
- 3.修改ID相关的macro逻辑,统一使用id_macro,并限制在'$EXPERT_ID', '$LAYER_ID'范围内使用
13+
- 4.为load hf checkpoint添加单测
14+
- 5.修复full param的bug,并添加相关的cast单测
15+
- 6.添加get_var_mapping_chain_macro,支持中间变量继承src_key、dst_key的切分信息,并添加单测
16+
- 7.修复build_input_vars的bug
17+
- 8.修复merge_sharded_state_dict,支持单卡运行
18+
19+
**API相关工作(PR已提交,待合入)**
20+
- 1.优化17个loss函数的size_average和reduce的报错逻辑,当用户以pytorch习惯使用这些函数时,正确将size_average+reduce映射到reduction,并报错提示。
21+
- 2.对5个paddle的window函数进行封装,对齐torch的接口,使用时与torch相同,即paddle.xxx_window
22+
23+
24+
25+
### 下周工作
26+
27+
1.API相关工作推进
28+
29+
### 导师评价
30+
31+
32+
33+
34+
35+

0 commit comments

Comments
 (0)