Skip to content

Commit e828317

Browse files
committed
add report
1 parent 1a6efc8 commit e828317

File tree

3 files changed

+52
-2
lines changed

3 files changed

+52
-2
lines changed

WeeklyReports/Hackathon_7th/08_zty-king/aadiff检查_2021.10.25.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -88,8 +88,8 @@ $$
8888

8989
**再考虑一种num_micro_batches>pp_degree**
9090

91-
![image-20241025000830757](images/num_micro_batches>pp_degree时bubble_check插入位置分析图.png)
91+
![image-20241025000830757](images/num_micro_batches大于pp_degree时bubble_check插入位置分析图.png)
9292

93-
<div style="text-align: center;">num_micro_batches>pp_degree时bubble_check插入位置分析</div>
93+
<div style="text-align: center;">num_micro_batches大于pp_degree时bubble_check插入位置分析</div>
9494

9595
可以看到,规律还是如上公式所示。

WeeklyReports/Hackathon_7th/08_zty-king/images/num_micro_batches>pp_degree时bubble_check插入位置分析图.png renamed to WeeklyReports/Hackathon_7th/08_zty-king/images/num_micro_batches大于pp_degree时bubble_check插入位置分析图.png

File renamed without changes.
Lines changed: 50 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,50 @@
1+
### 姓名
2+
3+
李睿文
4+
5+
### 实习项目
6+
7+
混合专家架构自动切分推导优化
8+
9+
### 本周工作
10+
11+
1. **阅读文档学习Paddle自动并行机制**
12+
13+
- 分布式 ml 相关基础概念及框架实现:分布式张量概念、自动并行框架底层执行流程和原理 —— 切分推导和切分转换、自动并行和分布式策略 —— 数据并行,张量并行,流水并行和 3D 混合并行、自动并行相关 API 等 (https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/paddle_v3_features/auto_parallel_cn.html)
14+
15+
16+
2. **阅读文档学习切分推导规则开发流程**
17+
18+
- 切分推导相关概念及开发流程:分布式属性 —— process_mesh 和 dims_mapping、接口定义、计算类 op 及修改形状类 op 的规则开发、注册规则、单测开发 (https://github.com/PaddlePaddle/community/blob/master/pfcc/paddle-code-reading/auto_parallel/spmd_rules.md)
19+
20+
21+
3. **梳理deepseek v3所需算子的切分推导规则配置情况**
22+
23+
- 根据 PaddleNLP 中的 deepseek v3 模型实现 (https://github.com/PaddlePaddle/PaddleNLP/blob/develop/paddlenlp/transformers/deepseek_v3/modeling_auto.py),梳理出训练推理过程中可能需要用到的所有 API 及相应算子,排查对应算子的切分推导规则配置情况。以下 **API / 算子** 尚未配置切分推导规则:
24+
- _C_ops.embedding_with_scaled_gradient
25+
- paddle.expand
26+
- paddle.tril
27+
- _C_ops.memory_efficient_attention
28+
- paddle.incubate.nn.functional.fused_dot_product_attention
29+
- _C_ops.variable_length_memory_efficient_attention
30+
- paddle.einsum
31+
- F.tanh/F.gelu/F.leaky_relu/paddle.tanh/F.mish
32+
- paddle.log
33+
- paddle.topk
34+
- paddle.put_along_axis
35+
- paddle.gather
36+
- paddle.cumsum
37+
- paddle.erf
38+
- nn.CrossEntropyLoss
39+
40+
41+
#### 问题疑惑与解答
42+
43+
暂无
44+
45+
### 下周工作
46+
47+
1. 确定需要增加切分推导规则的 API / 算子,并进行切分推导规则的开发。
48+
49+
50+
### 导师点评

0 commit comments

Comments
 (0)