Un notebook pour automatiser le lancement de tests en fonction de différents paramètress by rprebot · Pull Request #32 · SocialGouv/srdt

rprebot · 2024-12-09T18:32:36Z

Le notebook importe les fonctions dans "framework_test_functions.py" et les instructions contenues dans 'instructions_LLM.py' (qui historise les versions de prompt)
3 paramètres de test sont possible sur ce notebook : le "top_K" de chunks récupérées en sortie de chaque queries, le choix du prompt (mistral/albert/chatgpt), et la version des instructions.

Pour la suite, il faut :

rajouter des paramètres de tests. En priorité, la possibilité d'ingérer le texte complet VS seulement le chunk aujourd'hui dans le prompt.
obtenir des scores de performance en approximant la précision / le recall, en comparant aux réponses types attendues dans la base de 20 questions annotées

…et obtenir la réponse. 3 paramètres existent pour l'instant : le "top_K" de chunks récupérées en sortie de chaque queries, le choix du prompt (mistral/albert/chatgpt), et la version des instructions. Pour cela le notebook importe 'instructions_LLM' (qui historise les versions de prompt) et framework_test_functions Pour la suite, il faut : - rajouter des paramètres de tests. En priorité, la possibilité d'ingérer le texte complet à la place du chunk dans le prompt. - obtenir des scores de performance approximant la précision / le recall sur la base de 20 questions annotées

RealVidy · 2024-12-11T11:44:36Z

Penchons-nous là dessus demain Rémi.
Je vais te montrer comment utiliser des notebooks en local de façon à ce que tu puisses travailler dans le repo directement plutôt que sur Google Colab. Ça rendra d'autant plus facile la création de scripts à partir de ton notebook.

Avec la méthode actuelle c'est difficile de review le code (en général on ne review pas des notebooks si on peut l'éviter) et surtout difficile d'intégrer le travail qu'a déjà fait Maxime.

RealVidy · 2024-12-11T11:45:07Z

Cela dit les résultats ont l'air cools !

gary-van-woerkens · 2025-05-19T13:33:45Z

Peut-on fermer cette PR @rprebot ?

rprebot added 4 commits December 9, 2024 14:38

Add files via upload

4f2a549

Update framework_test_functions.py

49c8a6d

Add files via upload

36cdb1a

rprebot requested review from RealVidy and maxgfr December 9, 2024 18:32

rprebot self-assigned this Dec 9, 2024

RealVidy force-pushed the main branch from d2018af to 36cdb1a Compare December 9, 2024 19:52

RealVidy force-pushed the framework_pipeline_test branch 2 times, most recently from 9ab8be5 to 0bdc485 Compare December 9, 2024 19:56

RealVidy force-pushed the main branch from 1090f2f to 40fb7e6 Compare December 12, 2024 15:58

maxgfr removed their request for review December 17, 2024 09:10

rmelisson force-pushed the main branch from 045e84c to 1c12554 Compare May 21, 2025 11:27

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Un notebook pour automatiser le lancement de tests en fonction de différents paramètress#32

Un notebook pour automatiser le lancement de tests en fonction de différents paramètress#32
rprebot wants to merge 4 commits intomainfrom
framework_pipeline_test

rprebot commented Dec 9, 2024

Uh oh!

RealVidy commented Dec 11, 2024

Uh oh!

RealVidy commented Dec 11, 2024

Uh oh!

gary-van-woerkens commented May 19, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Conversation

rprebot commented Dec 9, 2024

Uh oh!

RealVidy commented Dec 11, 2024

Uh oh!

RealVidy commented Dec 11, 2024

Uh oh!

gary-van-woerkens commented May 19, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants