Skip to content
Arblade edited this page Feb 7, 2021 · 1 revision

Wiki Projet Blue Alert

Introduction

Cette page a pour but de développer la théorie de détection et d'analyse de crises implémentée dans Blue Alert. En effet, il est important de bien comprendre le phénomène afin de pouvoir l'apprécier et l'analyser correctement par la suite.

I Qu'est ce qu'une crise ?

Larousse : Moment très difficile dans la vie de quelqu'un, d'un groupe, dans le déroulement d'une activité, etc. ; période, situation marquée par un trouble profond.

Une crise est donc un évènement chargé d'adversité qui rompt brutalement avec la normalité. Le terme de trouble y est associé : le dictionnaire le définit comme un désordre, ou comme ce qui n'est pas clair, net. Les émotions sont également associées à ce terme : angoisse, émotion amoureuse...etc.

On peut en extraire trois caractéristiques majeures :

  1. La scission avec la normalité. On entre alors dans un désordre, une situation de troubles.
  2. La puissance de l'évènement. Cela implique de grands effets dans sa manifestation, mais également dans la réaction à celle-ci.
  3. L'apparition d'émotions associées à ces situations, comme réactions humaines.

Que voulons nous analyser ?

Notre but est de détecter au plus tôt les crises et suivre leur développement via le réseau social Twitter. Celui-ci se démarque des autres par sa promptitude et sa capacité à rendre toute l'information publiée disponible au monde entier. Ce travail va donc consister à :

  1. Détecter l'avènement d'une crise.
  2. Alerter l'utilisateur
  3. Analyser la crise et en extraire les informations brutes ainsi que des données affinées permettant une meilleure compréhension de celle-ci, ceci tout au long de sa vie.

Comment détecter l'avènement d'une crise ?

L'avènement d'une crise est la période durant laquelle la crise va monter en puissance avant d'atteindre un état manifeste de crise. Par exemple sur Twitter cet état manifeste se voit entre autres par l'arrivée d'un mot clef associé à la crise en Trending Topics (TT) (dizaines de termes les plus utilisés sur twitter selon les régions).

Précisons dès maintenant que notre intérêt est de détecter la crise dans son ensemble et non pour le moment son évolution. Cette approche est plus large que la seconde qui revient à détecter une crise dans la crise.

Cette montée en puissance se manifeste dans un premiers temps par des signaux faibles.

Détecter les signaux faibles

Il existe, à mon sens, deux types de signaux faibles : les signaux directs et les signaux issus d'une analyse. Par exemple un tweet sur un coup de feu dans la ville de marseille est un signal direct, une activité accrue et négative d'une communauté de gamers sur le nouveau jeu d'Ubisoft est un signal complexe issu d'une analyse. Nous nous focaliserons d'abord sur les signaux directs, une autre étude inclura peut-être les signaux complexes.

« un signal faible est un fait à propos duquel seules des informations partielles sont disponibles alors qu’une réaction doit être entamée, si l’on veut qu’elle soit parachevée avant impact sur la firme de l’évènement nouveau ». (1)

Les informations sont partielles soit par leur contenu, soit par l'autorité de la personne qui émet l'information.

Identifier des signaux faibles nécessite de bien connaître le contexte d’une organisation et de ses parties prenantes. (1)

Il est nécessaire de faire une analyse du contexte à surveiller, ainsi que de ses acteurs et informateurs.

Synthèse intermédiaire

Les signaux faibles se caractérisent par leur information partielle, leur autorité d'émission non certifiée. Pour les surveiller il est important de prendre en compte ces points, et de cartographier le domaine à surveiller en termes d'acteurs et d'informateurs. Actions à mener :

  1. Cartographier le domaine ciblé en termes d'acteurs, d'informateurs et de mots clefs.
  2. Evaluer les auteurs de tweets en déterminant leur influence et leur autorité : font-ils partie du cercle d'informateurs ou d'acteurs connus du domaines ? Combien ont-ils d'abonnés leur faisant confiance ?
  3. Extraire les informations partielles et savoir les mettre en commun : pour identifier une tendance globale et déterminer le poids d'une information (plus crédible si affirmée plusieurs fois).

Focus sur la courbe d'une crise

Image of curve of crisis model

Nous pouvons voir ci-dessus la courbe d'une crise en terme de nombre de tweets publiés sur un domaine en fonction du temps. Notre but est de détecter les témoins et les médias alternatifs et locaux (j'inclue dans médias alternatifs les gros comptes pouvant retweeter ou citer des témoins).

Quelle algorithmique ?

Notre robot est capable de demander le nombre de tweets N incluant les termes R sur une durée d (intervalle [maintenant, maintenant-d]), ceci toutes les périodes P . Exemple : recherche du nombre de tweets publics incluant le mot "ouragan" (donc R=ouragan) publiés depuis 10 minutes (donc d=10), ceci toutes les 10 minutes (donc P=10) : Cela donne toutes les 10 minutes la recherche NombreTweet(ouragan, 10) est executée et retourne un entier.

Première stratégie

Fixer un seuil ?

Nous pouvons fixer un seuil S et une durée d, tel que si NombreTweet(R,d)>S, alors une alerte est levée.

image of first strategy

Cependant, cette technique ne pourra être menée que si on choisit empiriquement un seuil pour chaque domaine voire mot. En effet, chaque mot a une probabilité propre P_m d'apparaître sans crise. Donc le seuil devra s'adapter à chaque mot pour être légèrement au-dessus de son taux d'apparition normal.

Cette technique peut-être menée en deux temps : premièrement relevés sur plusieurs jours des tweets publiés sur le domaine pour analyser le comportement normal. Ensuite fixation du seuil avec une marge d'erreur.

Cette méthode peut être appliquée sur l'espace twitter global ou sur une liste twitter d'informateurs.

Mots-clefs ou liste d'informateurs ?

La réponse dépend du domaine. Pour quelqu'un qui voudrait détecter les séismes, il va se baser d'abord sur les mots clefs, puis sur une liste d'experts en sismologie. Pour quelqu'un qui voudrait détecter des évènements géopolitiques, il se basera d'abord sur une liste d'expert, puis pourra ensuite avec précaution mener des recherches sur l'espace public.

Références

  1. Sylvestre Guillaume, « Détecter des signaux faibles en cartographiant des tweets », I2D - Information, données & documents, 2016/3 (Volume 53), p. 12-15. DOI : 10.3917/i2d.163.0012. URL : https://www.cairn.info/revue-i2d-information-donnees-et-documents-2016-3-page-12.htm

Sujet similaire : https://github.com/EU-ECDC/epitweetr