Update Documentation

jordimas · jordimas · commit d139251fb2ea · 2026-05-01T11:10:00.000+02:00
diff --git a/README.md b/README.md
@@ -6,17 +6,55 @@ Els resultats estan compartits a https://www.softcatala.org/la-intelligencia-art
 ## Estructura del projecte
 
 ```
-model-eval/
-├── llm/          # Avaluació de models LLM
-│   ├── model.py          # Pipeline d'avaluació per a un model
-│   ├── run_evals.py      # Orquestrador per executar múltiples models
-│   └── summarize_results.py
-└── asr/          # Avaluació de models ASR
-    └── hf-eval.py        # Avaluació de WER/CER sobre FLEURS
+ai-eval-catalan/
+├── render_bar_charts.py      # Genera gràfics de barres HTML
+├── render_tables.py          # Genera taules HTML de resultats
+├── bar_chart_template.jinja  # Plantilla per als gràfics de barres
+├── llm/                      # Avaluació de models LLM
+│   ├── model.py              # Pipeline d'avaluació per a un model
+│   ├── run_evals.py          # Orquestrador per executar múltiples models
+│   ├── summarize_results.py  # Genera el JSON i HTML de resultats
+│   ├── table_template.jinja  # Plantilla per a la taula de resultats
+│   └── evals/                # Resultats JSON per model
+├── asr/                      # Avaluació de models ASR
+│   ├── hf-eval.py            # Avaluació de WER/CER sobre FLEURS
+│   ├── run_evals.py          # Orquestrador per executar múltiples models
+│   ├── summarize_results.py  # Genera el JSON i HTML de resultats
+│   ├── table_template.jinja  # Plantilla per a la taula de resultats
+│   └── evals/                # Resultats JSON per model
+└── mt/                       # Avaluació de traducció automàtica
+    └── mt.py                 # Avaluació de models MT
 ```
 
 ---
 
+## Publicació automàtica de resultats (CI/CD)
+
+Quan es fa un push a qualsevol branca, el workflow de GitHub Actions `.github/workflows/publish-llms-json.yml` executa automàticament els passos següents:
+
+1. **Genera els fitxers de dades** a partir dels resultats JSON individuals de `llm/evals/` i `asr/evals/`:
+   - `llm/summarize_results.py` → `llm/llms.json`
+   - `asr/summarize_results.py` → `asr/asrs.json`
+
+2. **Genera els fitxers HTML** de taules i gràfics de barres:
+   - `render_tables.py` → `llm/llms_table.html`, `asr/asrs_table.html`
+   - `render_bar_charts.py` → `llm/llms_bar.html`, `asr/asrs_bar.html`
+
+3. **Puja els fitxers a la branca `prod-data`**, que actua com a repositori de dades en producció:
+   ```
+   prod-data/
+   ├── llms.json
+   ├── llms_table.html
+   ├── llms_bar.html
+   ├── asrs.json
+   ├── asrs_table.html
+   └── asrs_bar.html
+   ```
+
+La web de [Softcatalà](https://www.softcatala.org) llegeix directament els fitxers de la branca `prod-data` per mostrar els resultats actualitzats.
+
+---
+
 ## LLM — Avaluació de models de llenguatge
 
 El pipeline `llm/model.py` avalua models GGUF (via `llama-server`) i models de l'API de Google AI (Gemini/Gemma) sobre benchmarks de català: