Skip to content

Latest commit

 

History

History
231 lines (124 loc) · 24 KB

File metadata and controls

231 lines (124 loc) · 24 KB

CRIHN 16 février 2026

  • 20 personnes en présence
  • En ligne : Drouin, Maxime, Vincent, Lazare, Parham

Dire et interpréter, les modèles de langage construisent-ils une identité, Jean-Philippe Magué

Lors de la précédente séance, intérêt à la capacité cognitive. Forme de signification. Élargir la réflexion aujourd’hui à une dimension plus sociale de ces modèles en se demandant si la question de l’identité a du sens ou pas.

« Claude’s constitution is the foundational document that both expresses and shapes who Claude is. » Anthropic, 2026. Anthropic se base sur une sorte de constitution qui définit une sorte de charte éthique. Ils disent que le document fondamental qui explique et conditionne qui est Claude. Qui est ce qui ? La question aurait pu être formulée en termes de what.

Un argument marketting qui anthromorphise leur modèle de langage, des raisons plus profondes ? Un peu des deux ?

Une manière d’aborder la question, peut être demande à Claude directement. En anglais fonctionne mieux. Répond un assistant AI produit par Anthropic. Plus du quoi que du qui dans la réponse spontanée de Claude. Mais la réponse si d’(un point de vue ontologique comme qqch qui relève du quoi, tout un tas d’attribut qui vont relever du qui. Notamment le fait qu’il s’exprime à la première personne. Qu’est-ce qui se cache derrière ce je ? Pas tout à fait évident, jusqu’à peu hormis nous, rien ne faisait ça. Est-ce que cette utilisation a du sens pour un artefact de parler à la première personne. Est-ce qu’une singularité se cache derrière ce je ?

Un enjeu de catégorie. Régime du who et du what. Des objets, des sujets. A première vue, distinct même si voit bien que des cas limites. Exemple chien, qui ça. Entre la fourmi et le chien graduation qui fait passer de l’objet au sujet. Mais quand considère les LLM, un axe pas du tout opérationnel. Sent bien que si des zones de regroupements, pas dans ses regrouperement classique que va pouvoir les positionner.

Des choses relevant de l’un et l’autre. À l’intersection les LLM. Mais ni l’un ni l’autre. Ni des objets purs ni des objets plein. Espace liminaire, dans cette frontière que des choses qui viennent se nicher. Hors de nos catégories std et vient s’y nicher.

Mais question identité peut être similaire à deux logiciels. MSWord vs Stylo. Deux identités différentes, certes. Mais ici pas dans ce registre là. Personnalité des concepteurs qui s’exprime. Ici qqch de plus fin qui vient se jouer.

Pour l’attraper revenir à la réponse. Il travaille en comprenant et générant du texte. Là que se cache tt la réflexion que peut déployer.

Face à un objet qui produit et interprète du texte, du langage. Or le langage par définition, directement qqch par lequel on exprime notre identité. À travers tt les strates du langage. Ce que l’on dit, notre propos, le contenu du discours déjà une forme d’expression de notre identité. Les langues par nature, des objets pétris de variation. Chacun parle de manière différente. Ces variations ne sont pas aléatoires mais directement liées à notre identité. Un dispositif social particulier qui est celui d’un séminaire. Rôles différents, dans la manière dont je m’exprime, adopte rôle du présentateur. Choix linguistiques différents, assumer ce rôle de présentateur. Joue, performe ce rôle prédéfini.

Dès que parle définit une identité. Un ensemble de valeur, croyances, connaissances qui viennent structurer ce que dit. Autrement dit tout acte énonciatif est socialement situé. Dès que dit énoncé, suppose que prend en compte le contexte social dans lequel prend place l’interaction. On ne peut pas énoncer qqch sans être socialement situé. Ne peut pas énoncer sans assumer un positionnement social. Par réciproque, tout acte interprétatif est socialement situé (là encore un peu tautologique).


Si on essaye de schématiser la communication. Quand un locuteur exprime qqch, l’exprime au filtre de son identité. Reçu par le locuteur qui le réceptionne au filtre de sa propre identité. En plus du message porté par la sémantique du discours transite l’identité. Circulations constitutives mêmes du langage.

Ces enjeux d’identités structurent l’interaction linguistique. Ne peut pas faire sans, tt cela fait profondément partie de l’interaction linguistique.

Du coup, quand pas entre deux êtres humains mais performé par une machine, on ne peut pas ne pas inférer une identité quand un texte est produit par une IA. À la limite pourrait repérer que produit par l’IA et reconnaître. Mais comme face à une situation d’énonciation, ne peut pas être dans ces mécanismes normaux de la langue.

Question même de savoir si les IA se construisent des identités ou pas, peut déjà y répondre par le fait même de l’interaction linguistique. À la limite savoir si une IA a une identité ou pas devient presque secondaire du fait que l’on projette nous une identité sur ces modèles.


Une première conclusion à laquelle peut aboutir, mais pas complètement épuisé la discussion. Creuser pour comprendre en quoi peuvent se rapprocher des identités que l’on construit dans notre vie.

La façon dont se construisent ces identités, pas du tout la même. Systèmes de valeur, de connaissance qui viennent structurer notre discours viennent de notre histoire sociale. Naissance, éducation, parcours de vie qui construisent qui nous sommes aujourd’hui. Sans doute avec un sous-bassement commun.

Dans un LLM ce qui peut venir construire ces systèmes de valeurs et de connaissance, façon dont entraîné et les données avec lesquelles entraîné. Peut dire que pas affaire au même processus et qu’identités pas similaires dans le mode de construction. Mais des systèmes de valeur de connaissances, construits. Cf. Rozado 2024 qui vient positionner des modèles dans des espace politiques.

Plusieurs formes d’argument pour distinguer

Notre identité serait vraie, celle des modèles manipulable : Possibilité d’insuffler au modèle des identités par des prompts cf. Serapio-Garcia et al. 2025. Simplement avec des prompts capables d’orienter le modèle à travers des prompts. Alors identité pas dans le modèle mais plus superficiel.

Mais un mauvais argument car nous aussi nous sommes capables de faire cela. Capable de comprendre comment sont structurés les systèmes de pensée des autres. Le principe même de la fiction, être capable de se mettre dans la peau d’un autre. Pas parce que l’on a sa propre identité que pas capable de performer une autre identité.

Autre objection. Dans notre identité, une forme de continuité narrative qui nous fait prendre conscience que celui que sommes aujourd’hui le même que celui il y a 1 an. Pas le cas avec le LLM car à chaque nouvelle interaction, remis à zéro. Continuité de soi-même au contraire très absente chez l’IA. Argument plus intéressant mais insuffisant car pas très difficile d’imagine un système capable d’apprendre en continu et de construire comme cela une propre singularité se déployant dans le temps. Par exemple comme un robot qui aurait une mémoire narrative venant construire son identité. D’ailleurs, émergence des agents openClaude capable de construire mémoire interaction. Tt tracé d’avoir des agents parce qu’ils vont durer dans le temps capables.

Autre argument que peut peut-être opposer à l’identité des LLM, prendre leur origine dans notre vécu. Identité qui se manifeste dans notre agentivité, notre libre arbitre ? Un LLM tant que ne lui pose pas une question, pas capable de répondre. Pas très envie de l’attribuer aux LLM. Mais sans doute tt une question à avoir sur l’agentivité de l’être humain. Si LLM dans un système ouvert va pouvoir rentrer dans ce cycle de réaction. Sans doute comme cela que pour nous fonctionne. Très dubitatif sur cette notion du libre arbitre. Facile à trancher philo. Monde physique déterminé. Monde psychique capable de sortir du déterminisme. Alors où voir que sort de cela ? Voie de contestation identité des LLM vient sans doute du fait que surestimer nos capacité.

Notion de Ipséité, nom utilisé par les philo pour désigner sentiment d’être soi et pas qqun autre. Différence du soi et du non soi. Connaissance intime qui est difficile à appliquer aux LLM pour la raison que très phénoménologique. Expérience vécue à la première personne être qqun de vivant. Du mal à l’attribuer aux LLM. Noter toutefois qu’il existe des pathologie de cette expérience phénoménologique où distinction entre soi et l’autre. Pas certain que soit constitutif de l’identité. Car cette pathogénies même définitoire de l’identité de ces personnes comme schizo.

Oui, mais. Touche différence fondamentale entre eux et nous. De la même manière qu’avait conclu que identité fonctionnelle et pas intentionnalité phénoménologique (vécu aboutness). Arrive même clsion, pas exp être qui on est mais néanmoins moins participent à ces expériences d’être socialement situés. Sont dans des dispositifs d’énonciation mais sans être énonciateurs au sens où on l’est.

Alors catégories que créent ne fonctionne pas. Pour pouvoir construire des discours avec ces objets là. Besoin de ... pour reconstruire des catégories de pensées.


Lynne Bowker, les GML et les pratiques discursives socialement situées. L’exemple de la traduction

Présenter le point de vue des traducteurs humains et comparaison avec les grands modèles de langues pour faire des traduction.

La traduction est une activité intrinsèquement sociale. Pas une activité neutre. Tous leurs voix et prennent des décisions en fonctions de différents facteurs, normes sociales et besoins du public visé. Peut tout de suite voir que pris une décision.

Exemple, comment dire de manière inclusive traducteur. Vers le français : traducteur, traductrice, etc. traductaire ! Une décision à prendre, mais aussi contrainte espace. Choix solution épicène. Pas un acte neutre.

Une des façons de comprendre les forces et les faiblesses des grands modèles de langage par rapport à la traduction, utile de mieux comprendre la traduction humaine. Des enjeux avec les outils IA. Dans le passé des outils principalement dans les mains des professionnels. Traduction automatique une approche qui date de près de 80ans. Début après guerre. Mais aujourd’hui devenu ubiquitaire.

Depuis une décennie un intérêt très élevé pour pouvoir accéder à ces outils directement. Plus seulement dans les mains des traducteurs professionnels, mais comme service web. Qqch qui a commencé à présenter un intérêt extrême dès l’arrivée des grands modèles de langage.

Un calcul il y a 5 ans, gds modèles neuronals. 99,07% utilisateurs de ces outils ne sont pas des traducteurs. Cela présente des enjeux car une compréhension simplifiée.

Des idées reçues.

  • Unité principale le mot
  • Activité principale : substitution (chiffrage déchiffrage)
  • Multilinguisme des traductaires
  • Capables de traduire n’importe quel txt

Traductaires

  • Unité principale le concept, idée, message « Translation is not about about words. It’s about what the works are about. » Kevin Hendzel 2012.
  • Cherche à établir une équivalence appropriée
    • sémantique
    • formelle
    • de l’effet, de l’émotion
  • La plupart des textes à traduire sont de nature pragmatique et spécialisée (pas littérature)

Exemple : It’s the most wonderful Tims of the year vs Vive le Tim des fêtes. Une traduction car donne le même effet.

Kasperé et al. 2021 (neuronal car avant introduction des grands modèles de langage). 402 répondants non traductaires en Lituanie. Grande diversité de domaine d’application. Certains personnels, autres domaines où conséquences d’une mauvaise traduction plus élevée. Souvent utilisation au travail : brevets, médecins, loi, juridique, éducation, recherche, administration.

Demande compétences nécessaires pour traducteur. Bilinguisme, multilinguisme essentiel. Besoin expertise en rédaction. Mais aussi connaissance public cible, connaissances culturelles, domaine, typologie des textes. Compétences en recherche (25% au moins jusqu’à 40%), capacité analyse des risques, jugement, capacité à prendre des décisions.

Mandat de traduction. Cadre décisionnel, fourni par le client. Important pour pouvoir prendre des décision plus pertinentes. Fournit l’information sur le but.

La traduction est ancrée dans la société. = agent social, influencée par des facteurs sociaux.

Une rtivité avec une intention. Christiane Nord. Translating ad a Purposeful Activity. Un autaire, une voix, un style, un idiolecte. Un message, le contenu. Un objectif : informer, convaincre, divertir, aider qqun à accomplir une tâche. Une intention.

Des intermédiaires qui interprète et réexpriment le texte de départ pour exprimer intention du texte. Respect but et intention auteur original. Mais garder respect pour besoin et attentes du public cible. Naviguer entre fidélité.

Traduction automatique

Pas nouvelle, technologies qui ont évoluées. Au début basée sur des règles avec dictionnaires. Mais succès limité car communication exige plus. Depuis 40 à 50 ans, développement d’approches basées sur les données. D’abord statistiques, où identifie des patrons et des calculs probabilistes. Observe entre les années 90 et 2010 une évolution impressionnante, à la grande déception des linguistes. Pas seulement les règles grammaticales qui comptent. Montre que locuteurs dans une large mesure des créateurs routiniers. Communication qui ne fonctionne pas si ne se comprend pas.

Depuis 10 ans, les approches statistiques ont évoluées, approches neurones 2015-2022, puis les GML depuis 2002. Fluidité améliorées, peut masquer les manques de précision : « ça semble naturel, cela doit être correct ».

TA neuronale

  • Conçue pour une seule tâche : la traduction
  • Données d’entraînement gd volume, textes bilingues et parallèles
  • Adaptation de domaine et de plus en plus courant

Les GML

  • Conçu pour plusieurs tâches
  • Données entraînement volume énorme, conduit opportunisme n’importe quel txt numérique internet public (mélangés, beaucoup de transcription de textes oraux), très hétérogènes

Ts deux des modèle axé sur les données est très influencé par les données d’entraînement. Est-ce qu’un Petit modèle de langage (PML) spécifique à une tâche qualité supérieur ? Question avantages un et autre.

Qu’est-ce que les traducteurs pro pensent des GML ?

Pas forcément opposés, mais qqs inquiétudes quant à l’utilisation par des gens qui ne comprennent pas la traduction.

  • Observe performance très variable, selon la combinaison linguistique, le domaine. Dépend des données entraînement.
  • Perspectives culturelles occidentales
  • Variétés linguistiques dominantes étoufes les moins répandues
  • Valeurs sociales du passé souvent amplifiées même si plus norme sociale. Biais, stéréotypes, etc.
  • Difficultés, terminologie spécialisée, noms propres, acronymes, conventions numériques, et même négation.
  • Manque de cohérence tt au long d’un texte
  • Aplatissement de la langue
  • Cadence plus typique pour le langage parlé (enthousiasme, etc.)
  • GML différents tous leur emprunte propre (idiolecte, selon données entraînement). Traducteur leur personnalité propre mais souvent cherchent à traduire voix de l’auteur et minimiser leur propre voix.

Possibilité améliorer les performance en fournissant une requête qui ressemble plus à un mandat de traduction.

Les traductaires ne peuvent pas prendre décisions appropriées dans le vide, ne peut attendre des GML de le faire.

Les traducteurs une activité sociale. De bons citoyens ? Cherchent à développer relations de confiance. Si pas mandat clair, demandent information supplémentaires. Souvent des erreurs potentielles. Alors pose la question au client. Fréquent.

Traducteurs travaillent dans le respect des principes éthiques. Ordre pro et code de déontologie. Nbx attentes sociales et pro. Au Québec OTTIAQ, 49 règles.

  • Tenir compte limites de ses aptitudes. Pas le cas du LLM. Si le demande pas pas d’évaluation qualité. Relation confiance. Emprunte, etc. Secret, etc.
  • Assurance contre faute pro, et responsabilité civile pour les erreurs
  • Actuellement outils pas de position éthique.

Discussion

Est-ce qu’un Hoplite dans une phalange même sentiment individuel. Quid de la phénoménologie ?

Compétence symbolique.

Interpréter

Modèle de langue ou de langage. Idée de modèle de langue là depuis longtemps. Modélisait une langue. Ici les modèles sont multilingues. La compétence qu’ils sont capables de construire

Pas de réponse définitive à cela. Ne vient-on pas se donner en tant qu’humain une spécificité que n’a pas réellement.

Ce qui reste n’est-ce pas tout ce que l’on n’a pas compris ?

Ce qui nous distingue le plus de ces LLM sans doute une expérience phénoménologique. Le fait que quand est là et que voit ce qui se passe, flux de conscience permanent qui fait que suis là et que sens les choses. Dit que les LLM n’ont pas.

Pas ombre d’une preuve que pas cela dans les deux sens. Une sorte de pari que fait de dire que pas là. Croyance, est-c que le fait de croire qu’un trait fondamental de mon expérience être humain, aucun intérêt. Pure illusion ou épiphénomène sans intérêt et que l’avoir ou pas pas la question.

Seule réponse qu’a, intime expérience de vivre les choses à la première personne. Partageable à travers une intersubjectivité. Et pas loin de partager avec un LLM et dès que s’arrête alors identifie qe dans l’illusion car pas la sienne.

R. Identité et fait que difficile à définir. Peu parlé de la personnalité. Test du big 5. Idée que humains une identité ou personnalité fixe, problématique. Fourchette sur échelle de personnalité. Défini d’emblée que varie en fonction du contexte dans une certaine limite.

Sans doute mélanger identité et personnalité. Mais si arrive à montrer que personnalité différente, alors sans doute plus large. Globalement d’accord avec le fait que qqch de très composite et malléable de notre personnalité. Mais à travers ces modifications ponctuelles (conjoncturelle, ou sagesse). Mais sans doute plus que notre corps comme fil conducteur. Mais à travers toutes ces transformations, sentiment que suis le même. Le même je qui perçoit les choses. Continuité là qui traverse les modifications de mon identité et fonde socle de ce que veut définir comme identité. Continuité de la trajectoire et sa fin.

Rmq : herméneutique du sujet, Foucault

Q : Poésie mystique, déconstruction de ce sentiment. Qqch à creuser ?

JP Expériences de transes où prend conscience que son soi.

Yann : Doit sans doute rejeter argument de substrat. Qqch spécifique dans le cerveau. Qqs définitions avancées peut être plus actionnables. Idée que le sens de soi, information bottelneck. Trop d’information qui implique de pouvoir créer un modèle. Pourrait s’appliquer dans le modèle du grand modèle de language. Voit tt de suite que pas de subjectivité car pas de processus de subjectivation. Pas de modèle qui permettent émergence d’un modèle de soi ou de l’autre non plus. Alors pas d’identité. Raison pour laquelle le rejetterais. Seulement prédiction token suivant.

JP Rejetterai prédiction token suivant. Preuves empiriques que ne produit pas le token suivant mais les tokens suivants et opérations qui émergent dans cette architecture plus complexes que cela. Ne sait pas si c’est vrai qu’il n’y a pas de modèle du soi et façon dont seront convoquées d’autres valeurs, préconception des choses. Pourrait tout à fait avoir leur place dans la manière dont vont agencer manière de les produire. À mon avis tt cela existe à l’intérieur. Sentiment que dire comment modèle va choisir tel ou tel modèle de valeur.

Yann : Oui sur propriétés émergentes. Peut être pas d’accord sur la subjectivation.

MVR et JP : Représentation idiosyncratique du monde. Rien contre le fait qu’il ait une personnalité. Lui donne une singularité. Il a une spécificité qui est à lui.

Margaux : Toujours perplexe dès lors que parle d’identité. Des questions que l’on a eu de manière récurrente sur le vivant. Ex animaux qui sentent. Rhétorique qui ne répondent pas aux choses, le plus souvent manière de répondre par rapport à nos propres catégories. Début sur la thématique de l’anthropologisation, m’a fait pensé aux agents conversationnels. Pensés comme des services plus que des outils. LLM pas pensés à travers un usage. Difficile de savoir si un usage ou pas. Pensés comme des services avec un principe d’adresse immédiate. Sentiment que change la tâche. Pas sûr que soit uniquement des utilisateurs, des éléments développés suite aux utilisations faites. La question du service intéressante à poser du point de vue de l’identité, mais aussi d’un usage ou de pratiques qui sont aussi des expertises.

JP sur la première partie, à quoi ça sert de poser la question. Le fait de venir titiller les limites de nos systèmes de catégories en soi intéressant car nous permet en circonscrivant les choses de manière plus précises, possibilités de définir des choses de la réalité de manière de plus en plus précise. Quelles bonnes manières de formuler ces différences, qu’est-ce qui compte, etc. Pas des réponses, mais formuler des questions de manière de plus en plus précise.

Pas été conçu comme des services. On a découvert des propriétés de ces trucs là dont s’est aperçu que capables de faire beaucoup plus que le prochain token, même si le design de départ. Un moment de découverte qui montre que possible découverte du texte et capable de faire beaucoup d’autres trucs. Ne pense pas qu’a été conçu comme un service. Se rend compte qu’en face d’un objet omnipotent, se pose la question de savoir jusqu’où peut aller, etc.

Margaux : Utilisation pour des thérapies, développe tt une perspective d’un LLM qui écouterait plus qu’un psy. Pas seulement la question de l’adresse mais aussi la réponse.

Bottleneck trop d’information pour la gérer et l’intégrer dans une identité. Mais à soi-même identité qu’incapable à recouvrir avec ce que serait. Mais avec ces modèles de langage actuellement fermés, pas capable de traiter de l’information en continu. Donc bien plus circonscrit que ce que nous pourrions être. Finalement peut être eux qui ont réellement une identité au sens strict ! Plus que nous.

JP Tjs question de cmt ơn reste le même en changeant. À travers ce changement. Comme le bateau de Thésée à travers le changement reste toujours le même. Notre identité pas corrompue par ces changements. Au contraire définie par le fait qu’à travers ces changements on conserve notre singularité.


Prochaine fois, ce que chg pour shs d’avoir ces outils là en poche. LLM et agents conversationnels. Deux grosses thématiques, effacement approches quali et quanti. Poss quali de manière quanti car outillage que pourrait mener à gd échelle. Effacement des lectures proches et distantes. Des outils dans un processus de lecture et interprétatif. Série oppositions qui nécessitent d’être repensées. Et questionnement épistémologique à prendre en compte car socialement situé. Besoin expliciter point de vue. Si pas capable alors science de merde.

Approche structuraliste, définition système dedans dehors du point de vue structuralisme.


Ontologique ou interactionniste

Performer identité.

Simulacre « Le simulacre n'est jamais ce qui cache la vérité – c'est la vérité qui cache qu'il n'y en a pas. Le simulacre est vrai. » (https://fr.wikipedia.org/wiki/Simulacres_et_Simulation#cite_note-1) >

Simulation. Simulation vs représentation

Prendre les décisions. Traduction brief, vs le prompt.

Subjectivité et énonciation

Fait pour aider des tâches, etc.