Skip to content

Conversation

@Olivierjaylet
Copy link
Collaborator

Utilisation d'optuna pour optimisation des parametres
Implementation d'un KMEAN

pipeline:

  • Extraction des politiques avec Sentence Transformer ;
  • Premier clustering avec FAISS KNN ;
  • Extraction TF-IDF ;
  • Deuxième clustering avec K-Means (max clusters = 500)

Les groupes sont inégalement distribués.
Méthode à améliorer pour obtenir des clusters plus convenables.

Olivierjaylet and others added 30 commits September 29, 2025 16:30
clustering, topic modelling et documentation
@fraboniface fraboniface deleted the branch dataforgoodfr:clustering_policies November 20, 2025 08:54
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

3 participants