Release v0.10.0: evaluation framework

Siddhant-K-code · ona-agent · Siddhant-K-code · commit 49f33eaede9e · 2026-04-05T09:11:27.000Z
New commands:
  agent-strace eval run &lt;session-id&gt;           score a session
  agent-strace eval compare &lt;session-a&gt; &lt;b&gt;    side-by-side diff
  agent-strace eval ci &lt;session-id&gt;            CI gate (exits 1 on fail)
  agent-strace eval dataset add|list|export    manage eval datasets

Built-in scorers: no_errors, regex, cost_under, files_scoped,
duration_under, custom. Config via .agent-evals.yaml (stdlib YAML
parser, no PyYAML). Dataset storage is local JSONL.

Zero new dependencies. 47 new tests.

Co-authored-by: Ona &lt;no-reply@ona.com&gt;
diff --git a/src/agent_trace/__init__.py b/src/agent_trace/__init__.py
@@ -1,3 +1,3 @@
 """agent-trace: strace for AI agents."""
 
-__version__ = "0.9.0"
+__version__ = "0.10.0"

Original file line number	Diff line number	Diff line change
`@@ -1,3 +1,3 @@`
`1`	`1`	`"""agent-trace: strace for AI agents."""`
`2`	`2`
`3`		`-__version__ = "0.9.0"`
	`3`	`+__version__ = "0.10.0"`