Skip to content

[Phase 3] Feature Engineering: Extend Graph Topological and Meta-path Features #5

@arthur0824hao

Description

@arthur0824hao

Goal

繼續擴展 Phase 4 的特徵庫 (Feature Bank),尋找更具鑑別度的圖結構特徵。

Context

目前 Phase3/data/feature_bank/ 已經有 balance_vol_4dim, base_34dim, burst_3dim, ratio_6dim, velocity_3dim 以及 sequence_bank。為了進一步提升模型表現,需要引入更深度的圖結構與節點關聯特徵。

Tasks

  1. 拓樸特徵 (Topological Features): 計算節點的 PageRank, Eigenvector Centrality, Degree distribution (in/out-degree ratio)。
  2. Motif/Graphlet 特徵: 計算節點參與的特定交易三角迴圈或星狀結構數量。
  3. 二部圖/異質圖特徵 (Bipartite/Heterogeneous): 探索跨帳戶-設備或帳戶-IP的 Meta-path 特徵。
  4. 將產出的新特徵存入 Phase4/data/feature_bank/ 並更新 registry.json。

Acceptance Criteria

  • 新特徵成功整合進 DataLoader,不會導致 OOM。
  • 在現有 Baseline 模型上進行 ablation study 證明特徵有效。

Metadata

Metadata

Assignees

No one assigned

    Labels

    phase/3Phase 3: esun_data explorationstatus/readyReady for execution by coding session

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions