format

kyle-256 · wenxie-amd · commit 73a5fff13f54 · 2025-10-23T17:28:13.000+08:00
diff --git a/primus/backends/torchtitan/models/llama3/model/model.py b/primus/backends/torchtitan/models/llama3/model/model.py
@@ -5,12 +5,13 @@
 ###############################################################################
 
 import torch
+from torch.nn.attention.flex_attention import BlockMask
 from torchtitan.models.llama3.model.model import Attention as TTAttention
 from torchtitan.models.llama3.model.model import apply_rotary_emb
-from torch.nn.attention.flex_attention import BlockMask
 
 AttentionMasksType = dict[str, BlockMask] | BlockMask
 
+
 class Attention(TTAttention):
     def forward(
         self,