Skip to content
Félix Revert edited this page Jul 21, 2025 · 1 revision

🎯 Elevator Pitch

Imaginez qu’un gouvernement puisse, du jour au lendemain, brûler la dernière copie de 60 milliards de livres. C’est ce qui se passe avec les données environnementales et sanitaires numériques. Le projet vise à prévenir cette disparition massive en créant une infrastructure de conservation décentralisée, pérenne et citoyenne.


🌐 Product Overview

Plus de 100 Po de données publiques sont à risque. Ces données sont vitales pour la transparence environnementale et sanitaire. Le projet répond à ce besoin par une solution de stockage et de diffusion pérenne, distribuée et vérifiable.


🧪 Vision produit

Un réseau de stockage décentralisé où les utilisateurs partagent leur espace disque local pour assurer la conservation des jeux de données. Une app desktop permet de s’y connecter facilement, en mode pair-à-pair (P2P).


🧬 POC (Proof of Concept)

  • Objectif : prouver que 10 nœuds peuvent répliquer un dataset en moins de 24h.
  • Technologies testées : Electron, WebTorrent
  • Indicateur clé : “Time to First Successful Dataset Replication”

🧵 Dispatcher (Middleware)

  • Fonction : interface entre la base de données centrale et les apps desktop
  • Tâches : identifier les datasets à sauvegarder, définir priorité, vérifier bande passante et espace disque

🧩 Shelter App

  • Créer un nœud local de stockage (shelter)
  • Interface utilisateur : landing page, sélection du stockage, feedback visuel
  • Statistiques visibles (nb de shelters actifs, volume stocké)

📦 Rescue Team

  • Recensement des datasets critiques via data.gov
  • Critères : source institutionnelle sensible (ex: EPA, NOAA, HHS)
  • Objectif : créer une liste filtrable et interrogeable de jeux de données à sauvegarder

🏢 Headquarter Team

  • Coordination de la réponse aux requêtes des shelters
  • Réponses basées sur : taille du shelter, priorité du dataset, disponibilité actuelle
  • Suivi des liens magnet/deeplink

🛠️ Stack Technique

  • Application desktop Electron + WebTorrent
  • Base de données PostgreSQL + API FastAPI
  • Docker pour la conteneurisation
  • Scripts Python pour ingestion, transformation, indexation des données CKAN

🗓️ Organisation Programme

  • Sponsor : Jack / CPO : Alison / Architecte : Julien / Designer : Fabien / Partenariats : Julie
  • Jalons : MVP septembre ; lancement GA fin de saison 14
  • Structure : équipes Shelter / Rescue / HQ

📊 Roadmap

  • T3 2025 : MVP, App desktop opérationnelle, Rescue List initiale
  • T4 2025 : tests de réplication à l’échelle, intégration partenaires, amélioration UI
  • 2026 : scale-up, sécurité, pérennisation

👥 Staffing

  • Rescue : backend (Python, CKAN), traitement données, base PostgreSQL
  • Dispatcher : backend API, matching, logiques de routage
  • Shelter : frontend React, UX, P2P
  • HQ : monitoring, interaction réseau, visualisation lien magnet

📂 Notes et gouvernance

  • Outil central de gestion : GitHub (issues, tâches, gestion de projet)
  • Réunions hebdo : onboarding, suivi de devs, priorisation de Rescue List
  • Hygiène : GitHub Actions, endpoints documentés

🔗 Data Rescue Initiatives

  • Porté par Julie Deng, coordination avec Data For Good France
  • Outils : questionnaire, modèle d’email de contact
  • Objectif : faire appel à des experts pour repérer et documenter les jeux à risque