llm-as-a-judge

lbourdois · web-flow · commit 8db644de2a50 · 2025-02-19T10:09:09.000+01:00
diff --git a/notebooks/fr/llm_judge.ipynb b/notebooks/fr/llm_judge.ipynb
@@ -4,7 +4,7 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "# Utilisation d'un *LLM-as-judge* 🧑‍⚖️ pour une évaluation automatisée et polyvalente \n",
+    "# Utilisation d'un *LLM-as-a-judge* 🧑‍⚖️ pour une évaluation automatisée et polyvalente \n",
     "_Auteur : [Aymeric Roucher](https://huggingface.co/m-ric)_  \n",
     "_Traducteur : [Loïck Bourdois](https://hf.co/lbourdois)_\n",
     "\n",
@@ -18,7 +18,7 @@
     "\n",
     "La liste des critères est encore longue. Et même si nous disposions d'une liste limitée, chacun d'entre eux serait difficile à mesurer : « concevoir un programme basé sur des règles pour évaluer les sorties est extrêmement difficile. Les mesures d'évaluation traditionnelles basées sur la similarité entre les résultats et les réponses de référence (par exemple, [ROUGE](https://hf.co/spaces/evaluate-metric/rouge), [BLEU](https://hf.co/spaces/evaluate-metric/bleu)) sont également inefficaces pour ces questions. »\n",
     "\n",
-    "✅ Une solution puissante pour évaluer les sorties d'une manière humaine, sans nécessiter de temps humain coûteux, est l'utilisation d'un *LLM-as-judge*, c'est-à-dire d'un second modèle pour juger les sorties du premier modèle.\n",
+    "✅ Une solution puissante pour évaluer les sorties d'une manière humaine, sans nécessiter de temps humain coûteux, est l'utilisation d'un *LLM-as-a-judge* (qu'on désignera simplement « juge » par la suite) c'est-à-dire d'un second modèle pour juger les sorties du premier modèle.\n",
     "Cette méthode a été présentée dans [Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena](https://huggingface.co/papers/2306.05685) que je vous encourage à lire.\n",
     "\n",
     "💡 L'idée est simple : demander à un LLM de faire la notation à votre place. 🤖✓ \n",