Skip to content

Commit 8db644d

Browse files
authored
llm-as-a-judge
1 parent 661087a commit 8db644d

File tree

1 file changed

+2
-2
lines changed

1 file changed

+2
-2
lines changed

notebooks/fr/llm_judge.ipynb

+2-2
Original file line numberDiff line numberDiff line change
@@ -4,7 +4,7 @@
44
"cell_type": "markdown",
55
"metadata": {},
66
"source": [
7-
"# Utilisation d'un *LLM-as-judge* 🧑‍⚖️ pour une évaluation automatisée et polyvalente \n",
7+
"# Utilisation d'un *LLM-as-a-judge* 🧑‍⚖️ pour une évaluation automatisée et polyvalente \n",
88
"_Auteur : [Aymeric Roucher](https://huggingface.co/m-ric)_ \n",
99
"_Traducteur : [Loïck Bourdois](https://hf.co/lbourdois)_\n",
1010
"\n",
@@ -18,7 +18,7 @@
1818
"\n",
1919
"La liste des critères est encore longue. Et même si nous disposions d'une liste limitée, chacun d'entre eux serait difficile à mesurer : « concevoir un programme basé sur des règles pour évaluer les sorties est extrêmement difficile. Les mesures d'évaluation traditionnelles basées sur la similarité entre les résultats et les réponses de référence (par exemple, [ROUGE](https://hf.co/spaces/evaluate-metric/rouge), [BLEU](https://hf.co/spaces/evaluate-metric/bleu)) sont également inefficaces pour ces questions. »\n",
2020
"\n",
21-
"✅ Une solution puissante pour évaluer les sorties d'une manière humaine, sans nécessiter de temps humain coûteux, est l'utilisation d'un *LLM-as-judge*, c'est-à-dire d'un second modèle pour juger les sorties du premier modèle.\n",
21+
"✅ Une solution puissante pour évaluer les sorties d'une manière humaine, sans nécessiter de temps humain coûteux, est l'utilisation d'un *LLM-as-a-judge* (qu'on désignera simplement « juge » par la suite) c'est-à-dire d'un second modèle pour juger les sorties du premier modèle.\n",
2222
"Cette méthode a été présentée dans [Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena](https://huggingface.co/papers/2306.05685) que je vous encourage à lire.\n",
2323
"\n",
2424
"💡 L'idée est simple : demander à un LLM de faire la notation à votre place. 🤖✓ \n",

0 commit comments

Comments
 (0)