rtk-ai
diff --git a/‎README.md‎
Lines changed: 15 additions & 21 deletions b/‎README.md‎
Lines changed: 15 additions & 21 deletions
diff --git a/‎assets/bench_data.json‎
Lines changed: 248 additions & 0 deletions b/‎assets/bench_data.json‎
Lines changed: 248 additions & 0 deletions
diff --git a/‎assets/benchmark.pdf‎
47.5 KB b/‎assets/benchmark.pdf‎
47.5 KB
diff --git a/‎assets/benchmark.png‎
291 KB b/‎assets/benchmark.png‎
291 KB
@@ -216,32 +216,26 @@ grit config set-s3 --bucket my-bucket --endpoint https://... --region auto
 
 ## Benchmarks
 
-### Feature Throughput (scripts/throughput/)
+<p align="center">
+  <img src="assets/benchmark.png" alt="Benchmark: grit vs git" width="800">
+</p>
 
-Measures what matters: how many features ship vs how many are lost to conflicts.
+Tested across 3 projects (ts-api, pi-calc, rust-service), 1 to 50 agents, 3 rounds each:
 
 ```
-50 agents, ts-api project:
-
-  RAW GIT                          GRIT
-  ──────                           ────
-  Features delivered:  5/50        Features delivered: 50/50
-  Features LOST:      45           Features LOST:       0
-  Agents conflicted:  45/50        Agents conflicted:   0/50
-  Work wasted:        90%          Work wasted:         0%
+         RAW GIT                         GRIT
+Agents  Merge Failures  Work Wasted    Merge Failures  Work Wasted
+─────── ──────────────  ───────────    ──────────────  ───────────
+     1       0%             0%              0%             0%
+     2      50%            50%              0%             0%
+     5      80%            80%              0%             0%
+    10      80%            80%              0%             0%
+    20      75%            75%              0%             0%
+    30      73%            73%              0%             0%
+    50      51%            51%              0%             0%
 ```
 
-### Merge Conflicts (scripts/synthetic/)
-
-Adversarial scenario: all agents edit different functions in the same files.
-
-```
-Agents │ Git Failures │ Grit Failures │ Git Conflict Files
-───────┼──────────────┼───────────────┼───────────────────
-    10 │  40/50 (80%) │     0/50 (0%) │              63
-    20 │  82/100(82%) │    0/100 (0%) │              89
-    50 │ 175/250(70%) │    0/250 (0%) │             175
-```
+> With 10 agents: git throws away **80% of all work**. Grit throws away **0%**.
 
 ### Run benchmarks
 
 
@@ -0,0 +1,248 @@
+{
+  "ts-api": [
+    {
+      "agents": 1,
+      "git_ok": 3,
+      "git_fail": 0,
+      "git_fail_rate": 0.0,
+      "grit_ok": 6,
+      "total_runs": 3
+    },
+    {
+      "agents": 2,
+      "git_ok": 3,
+      "git_fail": 3,
+      "git_fail_rate": 50.0,
+      "grit_ok": 6,
+      "total_runs": 6
+    },
+    {
+      "agents": 5,
+      "git_ok": 3,
+      "git_fail": 12,
+      "git_fail_rate": 80.0,
+      "grit_ok": 6,
+      "total_runs": 15
+    },
+    {
+      "agents": 10,
+      "git_ok": 7,
+      "git_fail": 23,
+      "git_fail_rate": 76.7,
+      "grit_ok": 14,
+      "total_runs": 30
+    },
+    {
+      "agents": 15,
+      "git_ok": 15,
+      "git_fail": 30,
+      "git_fail_rate": 66.7,
+      "grit_ok": 30,
+      "total_runs": 45
+    },
+    {
+      "agents": 20,
+      "git_ok": 15,
+      "git_fail": 45,
+      "git_fail_rate": 75.0,
+      "grit_ok": 30,
+      "total_runs": 60
+    },
+    {
+      "agents": 25,
+      "git_ok": 15,
+      "git_fail": 60,
+      "git_fail_rate": 80.0,
+      "grit_ok": 30,
+      "total_runs": 75
+    },
+    {
+      "agents": 30,
+      "git_ok": 24,
+      "git_fail": 66,
+      "git_fail_rate": 73.3,
+      "grit_ok": 30,
+      "total_runs": 90
+    },
+    {
+      "agents": 40,
+      "git_ok": 54,
+      "git_fail": 66,
+      "git_fail_rate": 55.0,
+      "grit_ok": 30,
+      "total_runs": 120
+    },
+    {
+      "agents": 50,
+      "git_ok": 84,
+      "git_fail": 66,
+      "git_fail_rate": 44.0,
+      "grit_ok": 30,
+      "total_runs": 150
+    }
+  ],
+  "pi-calc": [
+    {
+      "agents": 1,
+      "git_ok": 3,
+      "git_fail": 0,
+      "git_fail_rate": 0.0,
+      "grit_ok": 6,
+      "total_runs": 3
+    },
+    {
+      "agents": 2,
+      "git_ok": 3,
+      "git_fail": 3,
+      "git_fail_rate": 50.0,
+      "grit_ok": 6,
+      "total_runs": 6
+    },
+    {
+      "agents": 5,
+      "git_ok": 3,
+      "git_fail": 12,
+      "git_fail_rate": 80.0,
+      "grit_ok": 6,
+      "total_runs": 15
+    },
+    {
+      "agents": 10,
+      "git_ok": 6,
+      "git_fail": 24,
+      "git_fail_rate": 80.0,
+      "grit_ok": 10,
+      "total_runs": 30
+    },
+    {
+      "agents": 15,
+      "git_ok": 11,
+      "git_fail": 34,
+      "git_fail_rate": 75.6,
+      "grit_ok": 26,
+      "total_runs": 45
+    },
+    {
+      "agents": 20,
+      "git_ok": 12,
+      "git_fail": 48,
+      "git_fail_rate": 80.0,
+      "grit_ok": 22,
+      "total_runs": 60
+    },
+    {
+      "agents": 25,
+      "git_ok": 25,
+      "git_fail": 50,
+      "git_fail_rate": 66.7,
+      "grit_ok": 52,
+      "total_runs": 75
+    },
+    {
+      "agents": 30,
+      "git_ok": 26,
+      "git_fail": 64,
+      "git_fail_rate": 71.1,
+      "grit_ok": 54,
+      "total_runs": 90
+    },
+    {
+      "agents": 40,
+      "git_ok": 26,
+      "git_fail": 94,
+      "git_fail_rate": 78.3,
+      "grit_ok": 54,
+      "total_runs": 120
+    },
+    {
+      "agents": 50,
+      "git_ok": 45,
+      "git_fail": 105,
+      "git_fail_rate": 70.0,
+      "grit_ok": 54,
+      "total_runs": 150
+    }
+  ],
+  "rust-service": [
+    {
+      "agents": 1,
+      "git_ok": 3,
+      "git_fail": 0,
+      "git_fail_rate": 0.0,
+      "grit_ok": 6,
+      "total_runs": 3
+    },
+    {
+      "agents": 2,
+      "git_ok": 3,
+      "git_fail": 3,
+      "git_fail_rate": 50.0,
+      "grit_ok": 6,
+      "total_runs": 6
+    },
+    {
+      "agents": 5,
+      "git_ok": 4,
+      "git_fail": 11,
+      "git_fail_rate": 73.3,
+      "grit_ok": 6,
+      "total_runs": 15
+    },
+    {
+      "agents": 10,
+      "git_ok": 6,
+      "git_fail": 24,
+      "git_fail_rate": 80.0,
+      "grit_ok": 16,
+      "total_runs": 30
+    },
+    {
+      "agents": 15,
+      "git_ok": 14,
+      "git_fail": 31,
+      "git_fail_rate": 68.9,
+      "grit_ok": 28,
+      "total_runs": 45
+    },
+    {
+      "agents": 20,
+      "git_ok": 15,
+      "git_fail": 45,
+      "git_fail_rate": 75.0,
+      "grit_ok": 28,
+      "total_runs": 60
+    },
+    {
+      "agents": 25,
+      "git_ok": 15,
+      "git_fail": 60,
+      "git_fail_rate": 80.0,
+      "grit_ok": 30,
+      "total_runs": 75
+    },
+    {
+      "agents": 30,
+      "git_ok": 30,
+      "git_fail": 60,
+      "git_fail_rate": 66.7,
+      "grit_ok": 30,
+      "total_runs": 90
+    },
+    {
+      "agents": 40,
+      "git_ok": 60,
+      "git_fail": 60,
+      "git_fail_rate": 50.0,
+      "grit_ok": 30,
+      "total_runs": 120
+    },
+    {
+      "agents": 50,
+      "git_ok": 90,
+      "git_fail": 60,
+      "git_fail_rate": 40.0,
+      "grit_ok": 28,
+      "total_runs": 150
+    }
+  ]
+}