-
Notifications
You must be signed in to change notification settings - Fork 2
Home
Imaginez qu’un gouvernement puisse, du jour au lendemain, brûler la dernière copie de 60 milliards de livres. C’est ce qui se passe avec les données environnementales et sanitaires numériques. Le projet vise à prévenir cette disparition massive en créant une infrastructure de conservation décentralisée, pérenne et citoyenne.
Plus de 100 Po de données publiques sont à risque. Ces données sont vitales pour la transparence environnementale et sanitaire. Le projet répond à ce besoin par une solution de stockage et de diffusion pérenne, distribuée et vérifiable.
Un réseau de stockage décentralisé où les utilisateurs partagent leur espace disque local pour assurer la conservation des jeux de données. Une app desktop permet de s’y connecter facilement, en mode pair-à-pair (P2P).
- Objectif : prouver que 10 nœuds peuvent répliquer un dataset en moins de 24h.
- Technologies testées : Electron, WebTorrent
- Indicateur clé : “Time to First Successful Dataset Replication”
- Fonction : interface entre la base de données centrale et les apps desktop
- Tâches : identifier les datasets à sauvegarder, définir priorité, vérifier bande passante et espace disque
- Créer un nœud local de stockage (shelter)
- Interface utilisateur : landing page, sélection du stockage, feedback visuel
- Statistiques visibles (nb de shelters actifs, volume stocké)
- Recensement des datasets critiques via data.gov
- Critères : source institutionnelle sensible (ex: EPA, NOAA, HHS)
- Objectif : créer une liste filtrable et interrogeable de jeux de données à sauvegarder
- Coordination de la réponse aux requêtes des shelters
- Réponses basées sur : taille du shelter, priorité du dataset, disponibilité actuelle
- Suivi des liens magnet/deeplink
- Application desktop Electron + WebTorrent
- Base de données PostgreSQL + API FastAPI
- Docker pour la conteneurisation
- Scripts Python pour ingestion, transformation, indexation des données CKAN
- Sponsor : Jack / CPO : Alison / Architecte : Julien / Designer : Fabien / Partenariats : Julie
- Jalons : MVP septembre ; lancement GA fin de saison 14
- Structure : équipes Shelter / Rescue / HQ
- T3 2025 : MVP, App desktop opérationnelle, Rescue List initiale
- T4 2025 : tests de réplication à l’échelle, intégration partenaires, amélioration UI
- 2026 : scale-up, sécurité, pérennisation
- Rescue : backend (Python, CKAN), traitement données, base PostgreSQL
- Dispatcher : backend API, matching, logiques de routage
- Shelter : frontend React, UX, P2P
- HQ : monitoring, interaction réseau, visualisation lien magnet
- Outil central de gestion : GitHub (issues, tâches, gestion de projet)
- Réunions hebdo : onboarding, suivi de devs, priorisation de Rescue List
- Hygiène : GitHub Actions, endpoints documentés
- Porté par Julie Deng, coordination avec Data For Good France
- Outils : questionnaire, modèle d’email de contact
- Objectif : faire appel à des experts pour repérer et documenter les jeux à risque