Skip to content

Un notebook pour automatiser le lancement de tests en fonction de différents paramètress#32

Open
rprebot wants to merge 4 commits intomainfrom
framework_pipeline_test
Open

Un notebook pour automatiser le lancement de tests en fonction de différents paramètress#32
rprebot wants to merge 4 commits intomainfrom
framework_pipeline_test

Conversation

@rprebot
Copy link
Copy Markdown
Collaborator

@rprebot rprebot commented Dec 9, 2024

  • Le notebook importe les fonctions dans "framework_test_functions.py" et les instructions contenues dans 'instructions_LLM.py' (qui historise les versions de prompt)

  • 3 paramètres de test sont possible sur ce notebook : le "top_K" de chunks récupérées en sortie de chaque queries, le choix du prompt (mistral/albert/chatgpt), et la version des instructions.

Pour la suite, il faut :

  • rajouter des paramètres de tests. En priorité, la possibilité d'ingérer le texte complet VS seulement le chunk aujourd'hui dans le prompt.
  • obtenir des scores de performance en approximant la précision / le recall, en comparant aux réponses types attendues dans la base de 20 questions annotées

…et obtenir la réponse.

3 paramètres existent pour l'instant : le "top_K" de chunks récupérées en sortie de chaque queries, le choix du prompt (mistral/albert/chatgpt), et la version des instructions.

Pour cela le notebook importe 'instructions_LLM' (qui historise les versions de prompt) et framework_test_functions

Pour la suite, il faut : 
- rajouter des paramètres de tests. En priorité, la possibilité d'ingérer le texte complet à la place du chunk dans le prompt. 
- obtenir des scores de performance approximant la précision / le recall sur la base de 20 questions annotées
@rprebot rprebot requested review from RealVidy and maxgfr December 9, 2024 18:32
@rprebot rprebot self-assigned this Dec 9, 2024
@RealVidy RealVidy force-pushed the framework_pipeline_test branch 2 times, most recently from 9ab8be5 to 0bdc485 Compare December 9, 2024 19:56
@RealVidy
Copy link
Copy Markdown
Contributor

Penchons-nous là dessus demain Rémi.
Je vais te montrer comment utiliser des notebooks en local de façon à ce que tu puisses travailler dans le repo directement plutôt que sur Google Colab. Ça rendra d'autant plus facile la création de scripts à partir de ton notebook.

Avec la méthode actuelle c'est difficile de review le code (en général on ne review pas des notebooks si on peut l'éviter) et surtout difficile d'intégrer le travail qu'a déjà fait Maxime.

@RealVidy
Copy link
Copy Markdown
Contributor

Cela dit les résultats ont l'air cools !

@maxgfr maxgfr removed their request for review December 17, 2024 09:10
@gary-van-woerkens
Copy link
Copy Markdown
Contributor

Peut-on fermer cette PR @rprebot ?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

3 participants