Name	Name	Last commit message	Last commit date
parent directory ..
.archived/opencode_setup	.archived/opencode_setup
autonomous_agent_env	autonomous_agent_env
benchmark	benchmark
bmadmethod	bmadmethod
mistralvibecli	mistralvibecli
my_idea	my_idea
my_opencode_setup	my_opencode_setup
nix_isolated_env	nix_isolated_env
ohmyopencode	ohmyopencode
openclaw	openclaw
ralphy	ralphy
tests	tests
.gitignore	.gitignore
README.md	README.md
eliza_adapter.py	eliza_adapter.py
implementation_plan.md.resolved	implementation_plan.md.resolved

Name

Last commit message

Last commit date

implementation_plan.md.resolved

🤖 Benchmarking OpenClaw & Other AI Assistants

Dieses Repository enthält eine umfassende Testsuite und Benchmarking-Umgebung für verschiedene AI-Coding-Assistenten und OpenCode-Plugins. Das Ziel ist es, Metriken wie Ausführungsgeschwindigkeit, Token-Verbrauch und Code-Qualität in isolierten Docker-Umgebungen zu vergleichen.

📊 Benchmark-Ergebnisse & Ziel

Wir vergleichen die Leistung von AI Agents in standardisierten Szenarien.

Getestete Agents / Tools

Tool	Verzeichnis	Status	Beschreibung
Ralphy	`/ralphy`	✅ Ready	PRD-Orchestrator mit striktem Workflow
OpenClaw	`/openclaw`	🔧 Setup	Autonomer Agent für komplexe Aufgaben
Oh My OpenCode	`/ohmyopencode`	⏳ Pending	Plugin-Sammlung und Hilfsmittel
BMAD Method	`/bmadmethod`	⏳ Pending	Experimentelle Methodik

🛠 Setup & Installation

Voraussetzungen

Docker & Docker Compose
OpenCode CLI (optional, für lokale Entwicklung)
Node.js 20+

Starten der Benchmarks

Jeder Agent befindet sich in seinem eigenen Verzeichnis mit einem passenden Dockerfile und run.sh Skript.

Beispiel: Starten von Ralphy

cd ralphy
./run.sh

Beispiel: Starten von OpenClaw

cd openclaw
./run.sh

Docker Naming-Convention

Das Projekt nutzt eine strikte Namenskonvention für Docker-Container, um Konflikte zu vermeiden und Filterung zu erleichtern.

Images: benchmark/<tool-name> (z.B. benchmark/ralphy)
Container: benchmark--<tool-name> (z.B. benchmark--ralphy)
Labels: project=benchmark, component=<tool-name>

Alle aktiven Benchmark-Container anzeigen:

docker ps --filter 'label=project=benchmark'

🧪 Standard-Tasks

Alle Agents werden gegen denselben Satz von Aufgaben getestet, um Vergleichbarkeit zu gewährleisten.

Detaillierte Aufgabenbeschreibung: 📄 benchmark/standard_tasks.md

Setup: Initialisierung der Umgebung.
Implementation: Umsetzung eines Features (z.B. Weather CLI).
Refactoring: Code-Verbesserung.
Testing: Schreiben und Ausführen von Tests.

📈 Analyse

Detaillierte Analysen und Gedanken zur Architektur finden sich im Ordner my_idea.

Erstellt von Enving

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

🤖 Benchmarking OpenClaw & Other AI Assistants

📊 Benchmark-Ergebnisse & Ziel

Getestete Agents / Tools

🛠 Setup & Installation

Voraussetzungen

Starten der Benchmarks

Docker Naming-Convention

🧪 Standard-Tasks

📈 Analyse

FilesExpand file tree

openclaw-benchmark

Directory actions

More options

Directory actions

More options

Latest commit

History

openclaw-benchmark

Folders and files

parent directory

README.md

🤖 Benchmarking OpenClaw & Other AI Assistants

📊 Benchmark-Ergebnisse & Ziel

Getestete Agents / Tools

🛠 Setup & Installation

Voraussetzungen

Starten der Benchmarks

Docker Naming-Convention

🧪 Standard-Tasks

📈 Analyse