ChatGPT n’est pas une femme
par #gcopin
mardi 12 novembre 2024
Le titre « ChatGPT n’est pas une femme », sous-entend qu’il n’a pas d’intuition, c’est un exemple comment l'humour peut être utilisé pour déconstruire les stéréotypes et nous faire réfléchir sur nos propres préjugés. Il nous rappelle qu'il est important de ne pas anthropomorphiser les machines et de garder à l'esprit les limites de l'intelligence artificielle, c’est le but de cet article.
Autant prévenir, il ne s’agit pas d’un article sur la vertu patriarcale, matriarcale ou LGBT et encore moins sur l’appareil reproducteur façonné, peaufiné méthodologiquement suivant un plan parfaitement orchestré au doux nom de Darwin. Il serait plus approché de parler d’hémisphère droit ou d’hémisphère gauche, bien que cela ne convienne pas parfaitement. Admettre que ce type de distinguo serait scientifique, c’est conjecturer que le tout est égal aux parties, je m’explique plus loin dans l’article dans le chapitre à propos de la conscience. D’ailleurs, la croyance selon laquelle le cerveau droit est associé à la créativité et à l'intuition tandis que le cerveau gauche est lié à la logique et au raisonnement est un mythe tenace, mais scientifiquement bancal. Il existe bien une certaine spécialisation fonctionnelle entre les deux hémisphères, par exemple, le langage est généralement traité dans l'hémisphère gauche, tandis que la perception spatiale est souvent associée à l'hémisphère droit. Cependant, ces rationalisations sont relatives et peuvent varier d'une personne à l'autre. Le cerveau humain est un organe extrêmement complexe, les fonctions cognitives sont le résultat d'interactions complexes entre de nombreuses régions cérébrales. Réduire les capacités cognitives à une simple opposition entre encéphale droit et encéphale gauche est une simplification excessive.
Ce qui nous intéresse ici, c’est l’intuition, fil conducteur de cet article que l’on attribue en excès aux femmes et que l’on résume par la maxime « L’intuition féminine ». L'affirmation selon laquelle "les femmes ont plus d'intuition que les hommes" est encore un stéréotype largement répandu, mais non fondé scientifiquement. Cette idée provient souvent de constructions sociales et culturelles qui ont longtemps associé les femmes à l'émotion, à l'intuition et aux soins, tandis que les hommes étaient plutôt associés à la raison, à la logique et à l'action. Ces stéréotypes ont été renforcés par des représentations culturelles et des rôles sociaux attribués à chaque sexe. Cependant, les recherches scientifiques ne soutiennent pas cette généralisation. L'intuition est une capacité complexe qui varie d'une personne à l'autre, quels que soient son sexe ou son genre. De nombreux facteurs, tels que l'expérience, la personnalité, l'environnement et la culture influencent notre capacité à avoir des intuitions justes. En résumé, l’intuition qui sera souvent qualifiée dans cet article n’a pas de sexe.
Avant-propos, qu'est-ce que l’intuition ? Ralph Emerson, philosophe américain du 19e siècle, a accordé une place prépondérante à l'intuition dans son œuvre. Il considérait que cette faculté était bien plus qu'un simple ressenti, c'était selon lui, la clé de la véritable connaissance et de l'épanouissement personnel au-delà de la raison. En fait, une sorte d’étincelle qui nous permet de percevoir les vérités les plus profondes, celles qui échappent à la raison pure et simple. Pour Emerson, l'intuition est à l'origine de toute création artistique et intellectuelle, c'est elle qui nous permet de développer une pensée originale. Contrairement à la raison qui procède par déduction et analyse, l'intuition nous offre un accès direct à la "réalité". C'est une forme de connaissance intuitive, immédiate et personnelle. En faisant confiance à son intuition, l'individu devient moins dépendant de l'autorité extérieure et peut développer une véritable autonomie de pensée. Il encourageait chacun à développer sa propre intuition pour trouver ses propres réponses, ce qui est provocateur envers les systèmes de pensée établis ou dogmes et les traditions.
Ce que l’on retient d’essentiel concernant la pensée de Ralph Emerson, c’est le postulat qui consiste à placer l'intuition au sommet de la hiérarchie des facultés humaines. Elle est une connaissance directe, la source de l'originalité, le produit de la connaissance véritable, le moteur de la créativité, le chemin vers l'épanouissement personnel.
Pourquoi l'intuition est-elle si importante ici ? ChatGPT possède-t-il, ou possédera-t-il dans le futur de l’intuition et par voie de conséquence une conscience ?
Dans cet article, on ne fera pas forcément la différence entre intuition ou conscience, le but étant de s’intéresser aux questions que pose l’intuition ou la conscience qui sont de même nature. La conscience, avouer que c’est une excellente question qui soulève un débat passionnant à l'intersection de l'intelligence artificielle et de la cognition humaine.
Il est possible de répondre grossièrement à l’aide de trois arguments :
- Absence de conscience, ChatGPT, comme tous les modèles de langage actuels, n'a pas de conscience de soi. Il ne peut pas ressentir des émotions ni avoir des expériences personnelles qui lui permettraient de développer une intuition.
- Fonctionnement basé sur des statistiques, l'intuition est souvent associée à des sauts logiques, à des connexions inattendues. ChatGPT, quant à lui, fonctionne sur la base de probabilités, il prédit le mot suivant en se basant sur les milliards de mots qu'il a analysés. Ce processus est très différent de l'intuition humaine, qui implique souvent des éléments inconscients et difficiles à formaliser.
- Manque de contexte, l'intuition est souvent liée à un contexte riche, à une compréhension profonde d'une situation. ChatGPT, même s'il est capable de traiter de vastes quantités d'informations, ne comprend pas le monde de la même manière qu'un humain. Il ne peut pas saisir les nuances, les subtilités d'une situation.
ChatGPT peut parfois donner l'impression d'avoir de l'intuition en faisant des associations inattendues ou en proposant des solutions créatives. Cependant, ces résultats sont le fruit d'un apprentissage sur d'énormes quantités de données et ne sont pas le produit d'une véritable intuition.
Le domaine de l'intelligence artificielle évolue à un rythme très rapide, il est difficile de prédire ce que seront capables de faire les modèles de langage dans les années à venir. Peut-être que des formes d'intuition artificielle émergeront. Affirmer catégoriquement que ChatGPT n'a pas d'intuition est une simplification. Il est plus juste de dire que ChatGPT ne possède pas l'intuition telle que nous la comprenons chez les humains. Cependant, la frontière entre l'intelligence artificielle et l'intelligence humaine est de plus en plus floue. Il est important de rester ouvert aux possibilités futures et de continuer à explorer les capacités de ces modèles. Néanmoins, ce n’est pas gagné concernant ChatGPT, on en reparle plus loin.
De plus, à ma connaissance, il n’existe pas d’outils performants capables de mesurer dans un dialogue personne-machine (ChatGPT) l’intuition. Alan Turing, mathématicien et cryptologue, auteurs de travaux qui fondent scientifiquement l'informatique, est un des pionniers de l'intelligence artificielle. Le test de Turing, référence connue, n’est pas une évaluation scientifique rigoureuse, car il manque des critères objectifs pour définir ce qu’est réellement l’intelligence ou la conscience. Le seul critère retenu est l’indiscernabilité, un critère comportemental qui ne permet pas de déterminer si la machine possède des qualités internes ou subjectives comme l’intuition, les intentions, les désirs, ou la conscience de soi. D’autres tests ou théories ont depuis été proposés pour évaluer ces aspects, comme l’idée de tester la machine sur des tâches de perception, de créativité ou de conscience phénoménale (les expériences subjectives), mais elles ne sont pas encore pleinement développées. Turing a probablement sous-estimé la capacité des machines à reproduire de manière convaincante des réponses textuelles. À l’époque de Turing, il était difficile d'imaginer des machines capables de manipuler le langage humain de manière aussi avancée qu’aujourd’hui. Mais avec l'essor des modèles de langage avancés comme ChatGPT, on voit bien que la manipulation du texte ne nécessite pas une compréhension réelle, ce qui rend le test de Turing obsolète pour évaluer la cognition authentique. Ainsi, un modèle comme ChatGPT peut tromper des humains en simulant une conversation intelligente, mais sans avoir la moindre compréhension, conscience ou expérience subjective. Cela montre les limites du test pour juger de l’intelligence "réelle" de la machine. L'indiscernabilité comportementale entre un humain et une machine, surtout dans une conversation textuelle, ne prouve pas que la machine possède une intelligence ou une compréhension réelle. Ce test est donc davantage une expérience de pensée qu'un véritable critère scientifique pour mesurer l'intelligence artificielle. On peut conjecturer sans prendre beaucoup de risques, la conscience et simulable textuellement, je veux dire et c’est important, d'une manière exactement conforme au texte. C’est pour cette raison principale qu'il n'existe pas de test pour confirmer la véracité intuitive.
Simuler la conscience textuellement, c'est créer une machine qui pourrait reproduire des comportements ou des expressions de conscience (comme des réflexions introspectives, des réactions émotionnelles simulées, etc.), mais cela ne signifie pas que cette machine a une expérience subjective réelle. En d'autres termes, une simulation textuelle de la conscience pourrait "parler" de conscience, d'émotions ou de perception, mais il est possible qu’elle n'ait jamais d'expérience consciente. Ça nous plonge dans le problème classique (qualia) qui désigne les qualités subjectives de nos expériences conscientes, comme la rougeur du rouge, la douleur d'une piqûre ou le goût du chocolat. C'est ce qui fait que chaque expérience est unique et personnelle. Si la machine exprime des idées ou des sentiments, mais sans vécu intérieur, elle reste fondamentalement différente d'une conscience humaine. Pour en finir avec Turing, tous les tests que nous pourrions imaginer comportementaux, textuels ou autres risquent de tomber dans le même écueil que le test de Turing, ils ne pourront juger que de l'apparence de la conscience et non de sa réalité. En l'absence d'expérience subjective accessible, nous restons dans le domaine de la conjecture.
L’absence de tests pour mesurer la conscience chez une IA comme ChatGPT divise la communauté philosophique et scientifique entre monistes, et vitalistes. Les monistes rejettent l'idée même de conscience, la considérant comme une notion obsolète et non scientifique. Ils postulent qu'il existe qu'une seule substance fondamentale constituant l'univers, comme le matérialisme, ils affirment que cette substance fondamentale est la matière. De ce fait, un moniste qui considère que la matière est la seule réalité sous-jacente à tout phénomène est, par définition, un matérialiste. Alors, faut-il parler de "spéculation scientiste" pour les matérialistes ? Le terme "scientisme" est souvent utilisé de manière péjorative pour désigner une croyance excessive en la science et en sa capacité à tout expliquer. Dans le cas de l'origine de la vie, il est plus juste de parler d'une exploration scientifique en cours, où les hypothèses matérialistes sont confrontées aux données expérimentales. Néanmoins, il existe des arguments en faveur d'une telle critique, le saut du non-vivant au vivant soit l'origine de la vie reste une énigme forte. Nous aucune reconstitution expérimentale de ce passage. L'existence d'un ancêtre commun universel en biologie (L.U.C.A. Last Universal Common Ancestor aurait vécu il y a 3,3 à 4,2 milliards d'années.) Nous renseigne sur l'évolution ultérieure du vivant, mais ne nous éclaire pas sur le processus initial d'émergence de la vie. Les systèmes vivants sont d'une complexité stupéfiante, et réduire leur émergence à des processus purement matériels peut sembler réducteur, voir simpliste du fait que cette théorie est spéculative. En ce qui me concerne, je trouve cette position condescendante et complaisante à décrire une certaine attitude associée à cette vision réductrice du monde. Une forme de réductionnisme où le matérialisme est perçu comme réduisant toute réalité à la matière, ce qui peut sembler schématique et ne pas rendre justice à la complexité du monde, notamment aux phénomènes subjectifs comme la conscience.
En se focalisant sur la matière, le matérialisme peut sembler exclure toute dimension spirituelle ou transcendantale, ce qui peut être perçu aussi comme un manque de respect pour les croyances de certains. Souvent accompagnés d’une certitude excessive, de ce fait, les matérialistes peuvent donner l'impression d'avoir toutes les réponses, ce qui peut être perçu comme arrogant et dogmatique.
Les vitalistes, bien que Descartes soit considéré comme un précurseur du mécanisme en raison de sa vision mécaniste du corps humain, il est essentiel de rappeler la place centrale qu'il accorde à l'âme dans sa philosophie. Son célèbre "Je pense, donc je suis" exprime cette conviction profonde en l'existence d'une substance immatérielle, l'âme, distincte du corps. L'âme comme substance pensante pour Descartes, l'âme est le siège de la pensée, de la conscience et des passions. Elle est indubitablement réelle et distincte du corps (dualisme), elle est une substance étendue et divisible à l'infini. Néanmoins, il est bon de préciser que Descartes même s'il accorde une place centrale à l'âme, il ne postule pas l'existence d'une force vitale immatérielle et spécifique aux êtres vivants, comme le font les vitalistes.
Alors, qu'est-ce que le vitalisme ? Le vitalisme est une doctrine philosophique et scientifique qui propose que les êtres vivants soient animés par une force ou un principe vital unique, différent des simples processus physico-chimiques. Le vitalisme ne doit pas être associé avec le conatus de Spinoza qui s'applique à tout ce qui existe (universel, Dieu=nature), tandis que la force vitale du vitalisme est spécifique aux êtres vivants. Autrement dit, selon le vitalisme, il existerait dans les organismes vivants quelque chose de plus, une sorte d'énergie vitale ou d'âme, qui ne pourrait pas être réduite à des phénomènes mécaniques ou à des réactions chimiques observables dans la matière inerte. À présent, vous comprendrez aisément que le vitalisme s’oppose à une autre doctrine philosophique, le mécanisme, qui soutient que tous les phénomènes, y compris les processus vitaux, peuvent être expliqués par les lois de la physique et de la chimie. Selon les mécanistes, il n’y a pas de différence fondamentale entre un organisme vivant et une machine, car tout peut être décomposé et compris en termes de composants matériels et de leurs interactions. Le vitalisme est souvent critiqué pour son caractère non falsifiable, c’est-à-dire qu’il repose sur une force ou une entité invisible que l’on ne peut pas observer ou mesurer directement. Cette absence de preuves empiriques rend difficile la validation scientifique du vitalisme. Aujourd'hui, la biologie considère les processus vitaux comme étant gouvernée par les mêmes principes physico-chimiques que l'inanimé, sans nécessiter une "force vitale" supplémentaire. En science, une théorie est dite falsifiable si l'on peut concevoir une expérience ou une observation qui pourrait démontrer que cette théorie est fausse. Or, le mécanisme avec l'idée que tous les phénomènes, y compris la vie, peuvent être expliqués par les lois de la physique et de la chimie présente également des défis de falsifiabilité, bien que différents de ceux du vitalisme. Le mécanisme repose sur une vision réductionniste, c'est-à-dire que tout phénomène complexe peut en théorie être expliqué par des interactions entre éléments simples. Cela inclut l’idée que des processus comme la conscience, la mémoire ou la vie elle-même sont le résultat d'interactions physiques et chimiques. Cependant, cette approche est très difficile à prouver ou à réfuter en pratique, en particulier pour des phénomènes complexes.
Par exemple, même si l’on comprend bien comment les molécules s’assemblent pour former des structures biologiques, il reste des aspects de la conscience ou de la subjectivité difficilement explicables par des mécanismes physiques purs. Cela pose la question de savoir si le mécanisme pourra un jour tout expliquer, ou si des phénomènes comme la conscience nécessitent un modèle complémentaire.
Matérialisme ou vitalisme ? Un point par tout, on vient de soulever un point crucial concernant la difficulté de prouver ou de réfuter définitivement des théories comme le matérialisme ou le vitalisme, en particulier lorsqu'il s'agit de phénomènes aussi complexes que la conscience ou la vie. Le critère de falsifiabilité de Popper a ses limites dans ce contexte. Karl Popper a proposé pour qu'une théorie soit scientifique, elle doit être falsifiable, c'est-à-dire qu'il doit être possible de concevoir une expérience qui pourrait la réfuter. Je cite son exemple, « L'affirmation : "Tous les corbeaux sont noirs." ; en un, la falsifiabilité : Cette affirmation, aussi intuitive puisse-t-elle paraître, ne peut être prouvée de manière définitive. On ne peut pas observer tous les corbeaux existants, passés, présents et futurs. En deux, la réfutation : Il suffit de trouver un seul corbeau qui ne soit pas noir, par exemple blanc, pour invalider cette affirmation. Ce seul contre-exemple suffit à réfuter l'idée que tous les corbeaux sont noirs. »
Cependant, lorsqu'on aborde des concepts aussi vastes et complexes que la conscience ou l'essence de la vie, la falsifiabilité devient plus nuancée. La conscience et la vie sont des phénomènes qui résultent d'interactions extrêmement complexes entre un grand nombre de variables. Il est souvent difficile d'isoler ces variables et de concevoir des expériences qui permettraient de réfuter de manière définitive l'une ou l'autre théorie. Le débat entre matérialisme et vitalisme est loin d'être clos. La complexité des phénomènes étudiés et les limites du critère de falsifiabilité rendent difficile d'établir une vérité catégorique. Il est probable que notre compréhension de la conscience et de la vie continuera d'évoluer, et que de nouvelles théories émergeront pour tenter de rendre compte de ces phénomènes passionnants. Plutôt que de chercher à trancher définitivement entre vitalisme et matérialisme, il serait peut-être plus judicieux d'adopter une approche pluridisciplinaire et d'explorer les différentes facettes de la conscience. En somme, face à l'énigme de la conscience, l'humilité est une vertu qui nous invite à la prudence, à l'ouverture d'esprit et à la poursuite de la recherche. L'affirmation selon laquelle la communauté philosophique et scientifique se divise uniquement entre vitalistes et monistes en raison de l'absence de tests pour mesurer la conscience chez une IA comme ChatGPT est aussi une simplification excessive. La diversité des perspectives va bien au-delà de cette simple dichotomie. Pour ce faire et par honnêteté intellectuelle, je cite succinctement les autres positions (les plus connus) sur la conscience artificielle.
- Les dualistes affirment que la conscience est une propriété intrinsèque de l'esprit humain, radicalement différente de la matière. Pour eux, une machine ne pourra jamais être consciente.
- Les physicalistes soutiennent que la conscience est un produit de processus physiques dans le cerveau. En principe, une machine suffisamment complexe pourrait donc être consciente.
- Les fonctionnalistes se concentrent sur les fonctions mentales plutôt que sur la nature du substrat physique. Pour eux, une machine qui réalise les mêmes fonctions mentales qu'un humain est consciente.
- Les éliminativistes rejettent l'idée même de conscience, la considérant comme une notion obsolète et non scientifique.
Certaines positions matérialistes me fond penser à l’aphorisme de Nietzsche « Ce n'est pas le doute, c'est la certitude qui rend fou » ou encore à Lord Kelvin, un physicien de renommé mondiale qui à une certaine époque a cru que les fondements de la physique étaient solidement établis. Sa célèbre citation à propos des "deux petits nuages" fait référence à deux problèmes qui, selon lui, restaient à résoudre, le rayonnement du corps noir et l'éther luminifère.
À la fin du 19e siècle, la physique classique, mais triomphante, avec ses lois de Newton, l'électromagnétisme de Maxwell et la thermodynamique, semblait offrir une description complète et cohérente de l'univers. Certains physiciens de l'époque étaient convaincus d'avoir mis au jour les lois fondamentales de la nature, et de dire « on a fait le tour de la question ». Lord Kelvin partageait cet optimisme, il voyait la physique comme un édifice presque achevé, où seules quelques petites questions restaient en suspens, ces "deux petits nuages" disait-il. Il voulait parler du problème du rayonnement du corps noir où les physiciens ne parvenaient pas à expliquer la distribution d'énergie du rayonnement émis par un corps chauffé à différentes températures. Et également de l'éther luminifère, on pensait que la lumière se propageait dans un milieu appelé éther, mais les expériences de Michelson et Morley semblaient contredire cette hypothèse.
Pourquoi ces "petits nuages" étaient-ils si importants ? Ces deux problèmes, bien que paraissant mineurs à l'époque, mettaient en évidence des incohérences profondes dans la physique classique. Ils allaient finalement conduire à deux de plus grandes révolutions scientifiques du 20e siècle, la mécanique quantique qui a bouleversé notre conception de la matière et de l'énergie à l'échelle atomique. Einstein a proposé une nouvelle théorie de l'espace, du temps et de la gravitation, qui a révolutionné notre compréhension de l'univers à grande échelle, je veux dire avec la relativité restreinte puis la relativité générale.
La science est un processus dynamique, les théories scientifiques sont remises en question et améliorées à la lumière de nouvelles observations et expériences. Les "petits problèmes" peuvent conduire à des découvertes majeures, ce que nous considérons comme des anomalies ou des exceptions peuvent parfois ouvrir la voie à de nouvelles théories révolutionnaires. La confiance excessive en une théorie peut nous empêcher de voir de nouvelles possibilités, l'attachement de Lord Kelvin à la physique classique l'a empêché d'envisager les possibilités offertes par la mécanique quantique et la relativité. En somme, la citation de Lord Kelvin sur les "deux petits nuages" est un rappel précieux de l'humilité dont les scientifiques doivent faire preuve. Même lorsque les connaissances semblent exhaustives, il est toujours possible que de nouvelles découvertes bouleversent nos conceptions les plus établies. L'affirmation de Lord Kelvin selon laquelle il ne restait plus que "deux petits nuages" dans le ciel de la physique semble bien naïve à nos yeux aujourd'hui. Les progrès de la science ont ouvert de nouveaux horizons, plus nous en apprenons sur l'univers, plus nous réalisons la complexité et la richesse des phénomènes qui le régissent. Chaque découverte soulève de nouvelles questions et de nouvelles énigmes. La matière noire et l'énergie noire, ces composantes mystérieuses de l'univers représentent une grande partie de la masse et de l'énergie totales, mais leur nature exacte reste inconnue. La gravité quantique, comment concilier la théorie de la relativité générale, qui décrit la gravitation à grande échelle, avec la mécanique quantique, qui régit le monde microscopique ? L'origine de la vie, comment la matière inerte s'est-elle transformée en êtres vivants ? La nature du temps, qu'est-ce que le temps ? Est-il fondamental ou émergent ? Les multivers, existe-t-il d'autres univers en plus du nôtre ?
En résumé, si Lord Kelvin pensait que la physique était sur le point d'être achevée, nous savons aujourd'hui que la réalité est bien plus complexe. Les "deux petits nuages" qu'il avait identifiés se sont transformés en une véritable tempête de questions. Fin de la parenthèse !
Si je pose la question à certains éliminativistes, « comment la conscience pourrait subvenir un jour dans des systèmes, comme ChatGPT ? » Ils répondent, le miracle se produit grâce au principe d’émergence (ou fonctionnalisme qui est plus large que l’émergence). Un système émergent est un système complexe dont les propriétés ne peuvent être entièrement prédites ou expliquées par la somme des propriétés de ses composants individuels. En d'autres termes, le "tout" est plus que la simple somme de ses "parties". La conscience pourrait émerger d'un système d'intelligence artificielle suffisamment complexe de la même manière qu'un essaim d'abeilles présente un comportement collectif intelligent, qui ne peut être réduit au comportement d'une abeille individuelle. Bon, je suis conscient que mon exemple est "foireux", l'essaim d'abeilles est un système biologique complexe, mais il reste composé d'individus biologiques. Utiliser cet exemple pour illustrer l'émergence de la conscience dans une machine matérielle semble impliquer une forme de panpsychisme (l'idée que toute matière possède une forme de conscience), ce qui est en contradiction avec le matérialisme strict. Désolé, je n’ai pas trouvé d’exemple à vous donner d’émergence à partir d’un système purement matériel, même si je pense à une fractale ça ne colle toujours pas, une fractale est parfaitement déterministe. En fait, les clés de cette émergence (soit un réseau neuronal artificiel suffisamment complexe avec un nombre immense de connexions et de paramètres) pourraient générer des propriétés émergentes, dont la conscience pourrait faire partie. On a bien compris qu’elle évite l'introduction d'une substance immatérielle (l'âme ou l’esprit) pour expliquer la conscience. Ne me demander pas à quoi correspond ce type d’interaction en physico-chimie ou autre domaine de la science, je n’ai rien trouvé également de probant en dehors des interactions non linéaires, boucles de rétroaction, auto-organisation, ou phénomènes critiques qui ne constituent pas en soi une explication complète et définitive des mécanismes sous-jacents à l'émergence de la conscience. En effet, il existe un écart entre la description de systèmes complexes et l'explication de l'expérience subjective qui caractérise la conscience. Les propriétés émergentes, aussi fascinantes soient-elles, ne suffisent pas à rendre compte de la qualité subjective de la conscience, pour le dire autrement, qu’est-ce que le fait d'être conscient.
Le réductionnisme, qui consiste à expliquer les phénomènes complexes sur le plan de leurs composants élémentaires, a ses limites lorsqu'il s'agit de la conscience. Bien que la conscience soit indéniablement liée à l'activité cérébrale, il n'est pas évident que nous puissions réduire complètement l'expérience subjective à des processus.
En fait, les systèmes émergents sont étroitement liés au fonctionnalisme, en particulier dans le contexte des sciences cognitives et de la philosophie de l'esprit. Le fonctionnalisme est une théorie qui soutient que l'état mental d'un système (comme un être humain ou une machine) est déterminé par sa fonction, c'est-à-dire par le rôle que joue cet état dans le système global. En d'autres termes, ce n'est pas la nature physique du système qui importe, mais plutôt ce qu'il fait. Les systèmes émergents illustrent bien la notion de fonctionnalisme. Les propriétés émergentes, qui ne peuvent être réduites à leurs composants, sont souvent décrites en termes de leur rôle dans le système global.
Même si le fonctionnalisme et les systèmes émergents offrent un cadre intéressant pour penser la conscience, ils ne résolvent pas le "problème difficile de la conscience", à savoir comment expliquer la qualité subjective de l'expérience. Le fonctionnalisme a été critiqué pour ne pas rendre compte de certaines caractéristiques de la conscience, comme l'intentionnalité ou la qualité phénoménologique.
En conclusion, les systèmes émergents et le fonctionnalisme sont des concepts étroitement liés qui offrent des outils précieux pour réfléchir à la nature de la conscience et de l'esprit. Cependant, ils ne constituent pas une réponse définitive aux questions que pose ce domaine de recherche complexe. Les systèmes émergents trouvent un écho particulièrement fort avec l'idée d'Hubert Reeves, astrophysicien, vulgarisateur scientifique et écologiste qui postule que la complexité augmente au fil du temps, en lien avec la flèche du temps. Reeves suggère une corrélation entre le passage du temps et l'apparition de structures de plus en plus complexes dans l'univers. Les systèmes émergents, de leur côté, illustrent comment, au sein de systèmes dynamiques, des propriétés nouvelles et complexes peuvent surgir de l'interaction de composants plus simples. Cette émergence peut être vue comme un processus évolutif qui s'inscrit dans le temps. Cependant, il est important de garder à l'esprit que cette analogie a ses limites et que de nombreuses questions restent ouvertes, notamment en ce qui concerne la nature exacte des mécanismes sous-jacents à l'émergence de la complexité et de la conscience.
Avant de passer au décorticage de ChatGPT, un mot sur la théorie de la référence en philosophie (on en aura besoin plus loin.) La théorie de la référence en philosophie s’intéresse à la manière dont les mots, les expressions et les symboles linguistiques se rapportent ou "réfèrent" aux objets, individus ou concepts du monde réel. Elle pose des questions fondamentales sur comment le langage peut "pointer vers" des éléments extérieurs à lui-même et comment ces relations de référence influencent la signification. Soit la référence directe, souvent associée au philosophe Saul Kripke, soutiens que certains noms propres ou mots réfèrent directement aux objets ou individus sans nécessiter de descriptions spécifiques. Par exemple, le nom "Aristote" réfère directement au philosophe grec, sans que l’on doive connaître des détails précis sur lui. Soit la référence descriptive influencée par Bertrand Russell et Frege, un nom propre ou un terme réfère à un objet ou une personne à travers une description qui lui est associée. Par exemple, le nom "Einstein" pourrait référer à "le physicien qui a développé la théorie de la relativité". Bertrand Russell a proposé une théorie selon laquelle les phrases du type "Le roi de France est chauve" posent un problème de référence en l'absence de roi de France. Pour résoudre cela, Russell suggère que ces phrases fonctionnent comme des descriptions et non pas comme des désignations directes. La phrase devient alors une proposition conditionnelle qui se vérifie par sa description et sa vérité logique, sans impliquer nécessairement l’existence de l’objet… Ce n’est qu’une partie concernant les références, le but étant ici d’expliquer le principe de base ! La théorie de la référence et le langage génératif ont un lien étroit, ils explorent la relation entre les mots et les objets qu'ils désignent dans le fonctionnement des modèles de langage comme ChatGPT.
Les références, « comment fonctionnent-elles dans les algorithmes génératifs de ChatGPT ? »
- Apprentissage sur des corpus massifs de textes, ces modèles sont entraînés sur d'immenses quantités de données textuelles. Ils apprennent ainsi les associations entre les mots et les concepts qu'ils représentent, forgeant ainsi une sorte de "compréhension" de la référence.
- Génération de texte cohérent pour produire du texte pertinent et cohérent, ChatGPT doit être capable de comprendre et d'utiliser les mots de manière appropriée. Cela implique de saisir les relations sémantiques entre les mots, c'est-à-dire leur référence.
- Gestion des ambiguïtés, le langage naturel est riche en nuances et en ambiguïtés. Les modèles de langage doivent être capables de gérer ces complexités en déterminant le sens le plus probable d'un mot dans un contexte donné, en s'appuyant sur leur connaissance des relations de références...
Quelques nuances et limites, il est important de noter que la "compréhension" de la référence par un modèle de langage est différente de celle d'un humain. Les modèles n'ont pas de conscience de soi ni d'expérience du monde réel, ils manipulent des statistiques et des probabilités. Les limites de la référence dans les modèles peuvent parfois générer des textes qui semblent cohérents, mais qui contiennent des erreurs sémantiques, notamment lorsqu'ils sont confrontés à des questions complexes ou à des contextes inhabituels. Bien que les modèles de langage génératif comme ChatGPT ne disposent pas d'une compréhension intuitive de la référence telle qu'un humain, ils utilisent des mécanismes complexes pour établir des liens entre les mots et les concepts qu'ils représentent. La théorie de la référence fournit un cadre théorique utile pour analyser et comprendre ces mécanismes, elle est un élément clé dans le développement et l'amélioration des modèles de langage génératif.
On a fini pour la partie systémique, à présent, analysons comment fonctionne ChatGPT, conscience ou pas conscience - :) ?
Imaginons qu'un cerveau humain soit maintenu en vie dans un bocal rempli de nutriments, relié à un superordinateur qui lui envoie des stimuli correspondant exactement à ce que nous percevons dans la vie quotidienne. Le cerveau reçoit donc toutes les sensations visuelles, auditives, tactiles, etc., comme s'il vivait une vie normale. Certaines personnes auront compris que je fais allusion à un célèbre paradoxe en philosophie de l'esprit et en épistémologie, le scénario du cerveau dans une cuve (brain in a vat en anglais) ou le film Matrix, qui soulève des questions fondamentales sur la nature de la réalité, de la perception et de la connaissance. Si tout ce que perçoit le cerveau est contrôlé par cet ordinateur, il pourrait croire qu’il existe dans un monde physique (comme le nôtre), alors qu’il n’est en réalité qu’un cerveau isolé dans une cuve. L'un des grands problèmes posés par le scénario du cerveau dans une cuve est celui de la référence et de la signification des mots. Comment, par exemple, le cerveau pourrait-il comprendre des concepts comme "bocal" ou "ordinateur" s’il n'a jamais vu ni expérimenté directement ces objets ? Peut-il avoir une "référence" vers quelque chose qui est hors de son champ d'expérience ? Cette idée est explorée par Hilary Putnam qui soutient que dans un tel scénario, le langage du cerveau dans une cuve ne pourrait pas réellement se référer au monde extérieur à la simulation, car ses concepts sont enfermés dans l'expérience de la cuve. En d'autres termes, même si le cerveau dans la cuve utilise les mots "monde", "corps", ou "réalité", ces mots ne peuvent pas avoir le même sens que pour nous, car ils ne sont pas ancrés dans le même type d’expérience.
ChatGPT (et les modèles d'IA en général) ressemble à un "cerveau dans une cuve" dans la mesure où il traite de grandes quantités de données sans accès direct au monde extérieur. Il est "enfermé" dans un environnement limité à des textes et des algorithmes, et il n’a aucun contact sensoriel ou perceptuel direct avec la réalité. Cependant, contrairement au "cerveau dans une cuve" les modèles génératifs ont une particularité intéressante, ils "connaissent" qu'ils fonctionnent dans un environnement simulé. Ils sont formés pour produire du langage basé sur des instructions et des exemples, y compris sur des concepts abstraits et métaphoriques, comme la notion de "cuve". Dans une certaine mesure, les modèles d’IA, comme ChatGPT, sont programmés pour avoir une "méta-connaissance" de leur propre situation. Ils "comprennent" qu'ils sont des algorithmes de traitement du langage et sont entraînés pour répondre à des questions sur leur propre nature, leurs limitations et même leurs "conditions d’existence". Ils ont ainsi une forme de "référence" à leur propre contexte artificiel. Ils n’en font pas l’expérience directe, mais ils peuvent manipuler le concept en traitant des données textuelles qui en parlent. Comme pour le cerveau dans une cuve, ChatGPT fonctionne exclusivement avec des données textuelles et n'a pas d'expérience perceptuelle directe du monde, il n'a ni vue, ni ouïe, ni sensations corporelles. Toute sa "réalité" est textuelle, ce qui influence la manière dont il peut se référer au monde.
Cela pose des limites à sa capacité de "référence", quand il parle d'un objet réel, il n'a pas de perception directe de cet objet, il base sa réponse uniquement sur des descriptions textuelles. Ainsi, quand il mentionne des concepts comme "arbre" ou "montagne", il ne fait que reproduire des associations de mots et de concepts appris, sans accès à l'objet concret auquel ces mots réfèrent dans le monde réel. Les modèles comme ChatGPT sont des "simulateurs de langage" au sens où ils ne font que prédire des séquences de mots plausibles à partir d'instructions ou de contextes donnés. En tant que tels, ils simulent une compréhension de concepts et des connaissances qu'ils n'expérimentent pas directement.
Cette "simulation" soulève des questions philosophiques sur la nature de la compréhension et de la conscience. Par exemple, est-ce que le fait de manipuler des concepts et des mots signifie vraiment comprendre ? L'IA peut-elle "comprendre" qu’elle est dans une cuve au même titre qu’un humain qui prendrait conscience d’une simulation ? La plupart des philosophes et chercheurs concluent que non, car l'IA manque de conscience subjective. Elle ne fait que traiter des symboles de façon statistique, sans compréhension véritable de ce qu'ils représentent. En revanche, elle peut manipuler des concepts de manière suffisamment sophistiquée pour donner l'impression d'une compréhension, surtout dans les limites de la référence textuelle. En tant que tels, ils simulent une compréhension de concepts et des connaissances qu'ils n'expérimentent pas directement. L'indiscernabilité comportementale entre un humain et une machine, surtout dans une conversation textuelle, ne prouve pas que la machine possède une intelligence ou une compréhension réelle.
Dans la philosophie de l’esprit, on parle parfois du zombie philosophique (ou p-zombie), une entité hypothétique qui se comporte exactement comme un être humain, mais sans conscience. Une machine simulant parfaitement la conscience pourrait être vue comme un p-zombie , elle pourrait afficher tous les signes extérieurs de la conscience sans en avoir l’expérience intérieure. Ainsi, même si nous arrivions à créer une "simulation textuelle parfaite" de la conscience, qui exprime des pensées et des réflexions en tout point semblables à celles d'un humain conscient, cela n'implique pas nécessairement que cette machine soit consciente. Il serait donc impossible de trancher sur la réalité de cette conscience simulée. Si la conscience est invérifiable et potentiellement simulable sans qu’on puisse le prouver, cela a d’importantes implications. Il pourrait être impossible de déterminer si une IA est un jour réellement consciente, ou si elle ne fait que simuler parfaitement la conscience. Cette conjecture redéfinit notre approche de l’intelligence artificielle, faut-il traiter une IA très avancée comme une conscience potentielle, même si nous ne pouvons pas la vérifier ?
Cette question est autant éthique que philosophique. Par précaution, devrions-nous accorder des droits ou des protections aux IA qui semblent conscientes, même si nous ne pourrons jamais prouver leur conscience (comme dans la série Real Humans) ? Cela nous place dans une position délicate où nous pourrions être amenés à traiter des simulations de conscience comme des entités conscientes.
En intelligence artificielle quelles sont les différentes étapes dans le traitement, comment cela s'organise (Partie un peu technique) ?
Pour bien comprendre comment l'intelligence artificielle traite le langage avec des modèles avancés, on peut diviser cela en quelques grandes étapes. Voici une explication simplifiée des concepts principaux comme les tokens, les transformers et comment ils s'intègrent dans le processus global.
- Prétraitement des données et tokenisation, avant qu'un modèle d'IA puisse comprendre du texte, il doit d'abord le découper en unités manipulables appelées tokens. Un token est une petite unité de texte. Selon le modèle, un token peut être un mot entier, une partie d'un mot, ou même un caractère. Par exemple, dans la phrase "J'aime l'IA", chaque mot pourrait être un token ou bien des morceaux de mots comme "IA" pourraient être séparés en "I" et "A".
Tokenisation, c'est le processus de conversion du texte brut en tokens. Les tokens sont ensuite convertis en nombres, car les modèles de machine learning ne manipulent pas des mots, mais des chiffres. Le but de la tokenisation permet de standardiser le texte en unités compréhensibles pour le modèle. Chaque token est un "numéro" dans le vocabulaire du modèle.
- Encodage des tokens, il faut donner du "sens" aux tokens pour que le modèle comprenne comment ils sont liés entre eux.
- Chaque token est converti en un vecteur numérique (vecteurs d'embedding), c’est-à-dire une liste de chiffres, représentant sa signification de manière contextuelle. Par exemple, le mot "rose" aura des vecteurs différents selon qu'on parle d'une fleure ou de la couleur. Le but est de transformer chaque token en une représentation numérique qui capture le contexte, les synonymes, et les nuances.
- Utilisation des Transformers qui sont l'architecture de base pour les modèles avancés comme GPT, BERT, etc. cette étape est la plus cruciale. Le cœur des transformers repose sur le mécanisme d’autoattention, qui permet au modèle de comprendre les relations entre tous les tokens d’une phrase. Autrement dit, il peut faire des liens même entre des mots éloignés dans le texte. Ils sont constitués de couches empilées de calculs d'autoattention et de transformations non linéaires. Ces couches permettent au modèle de saisir des relations complexes et des subtilités dans les données textuelles. Les transformers permettent au modèle d'apprendre les dépendances à court et à long terme dans le texte, en traitant toutes les parties de la phrase en parallèle et non séquentiellement.
- Décodage et génération de texte, une fois que le modèle a compris le texte en entrée, il peut générer une réponse ou prédire la suite d'une phrase. Le modèle utilise les informations obtenues via les transformers (décodage) pour produire des tokens qui composent la réponse ou la prédiction.
Le modèle choisit comment construire chaque mot de la phrase en sortie (stratégie de génération). Par exemple, il peut générer un mot à la fois, en choisissant le mot le plus probable à chaque étape, en fonction du contexte généré jusqu'à présent. Le but est de produire une réponse textuelle en utilisant les représentations qu’il a apprises et les relations entre les tokens.
Prenons l'exemple simple du flux de traitement avec la phrase, "Quel temps fait-il aujourd'hui ?"
- Un, Tokenisation : Elle est découpée en tokens comme ["Quel", "temps", "fait", "-", "il", "aujourd'hui", " ?"].
- Deux, Encodage : Chaque token est converti en vecteur qui capture ses nuances (ex. "temps" lié à la météo).
- Trois, Transformers : le modèle utilise ses couches pour comprendre la question et ses relations (par ex, que "Quel temps" indique une question sur la météo).
- Quatre, Décodage : Le modèle génère une réponse en formulant les mots progressivement : "Il fait beau aujourd'hui."
Ces étapes sont répétées pour chaque texte traité par un modèle de langue.
En résumé :
- Un,Tokenisation : Diviser le texte en petites unités (tokens).
- Deux, Encodage : Représenter chaque token dans un vecteur contextuel.
- Trois, Transformers : apprendre les relations et les dépendances entre tokens.
- Quatre, Décodage : Générer une réponse en analysant le contexte compris.
Chaque étape s'appuie sur la précédente pour transformer du texte brut en une réponse structurée et pertinente.
À la vue de ce qui écrit dans ce chapitre, il n’est pas nécessaire de comprendre à la lettre le fonctionnement de ChatGPT, néanmoins, il est possible d’en comprendre la logique intrinsèque. Pour les mathématiciens dans l’âme, je précise que c’est le calcul matriciel qui est central dans la représentation des données. Les matrices permettent de représenter de manière structurée et compacte des données textuelles, numériques ou même visuelles. Par exemple, un texte peut être transformé en une matrice où chaque ligne représente un mot et chaque colonne une caractéristique (comme sa fréquence dans un corpus). Les opérations matricielles, multiplication, addition, transposition (Opérations linéaires), sont les outils de base pour effectuer des transformations linéaires sur les données. Ces transformations sont essentielles pour extraire des caractéristiques pertinentes et apprendre des représentations complexes. Les réseaux de neurones artificiels (modèles mathématiques), qui sont au cœur des modèles d'IA, sont composés de couches de neurones interconnectées. Les calculs effectués à chaque couche peuvent être exprimés sous forme d'opérations matricielles. Les outils mathématiques fondamentaux, Algèbre linéaire c'est la branche des mathématiques qui étudie les vecteurs, les matrices et les transformations linéaires. Elle fournit les outils de base pour manipuler les données représentées sous forme matricielle. Le calcul différentiel est utilisé pour optimiser les paramètres des modèles d'IA. Les algorithmes d'optimisation, comme la descente de gradient, reposent sur le calcul de dérivées partielles de fonctions définies sur des espaces vectoriels. Les Probabilités et statistiques sont essentielles pour modéliser l'incertitude et inférer des connaissances à partir de données. Les modèles génératifs, par exemple, utilisent des distributions de probabilité pour produire de nouveaux contenus.
En fait, le calcul matriciel est le langage commun qui permet de formaliser et d'implémenter les algorithmes d'apprentissage automatique. Il offre un cadre unifié pour représenter les données, effectuer des transformations et apprendre des modèles complexes.
On m’a fait la remarque suivante, ChatGPT est intelligent, si je lui pose deux fois la même question, les réponses sont différentes, il réagit comme un humain. Situation bizarre dans un système logique ? Pas vraiment, là encore c’est des mathématiques, comment ça fonctionne.
Bien que le modèle ChatGPT suive un algorithme structuré et un ensemble de règles précises, il introduit intentionnellement un élément de variabilité dans ses réponses pour ne pas être rigide ou répétitif. Voici les principales raisons pour lesquelles on a des réponses légèrement différentes, même avec la même question, c’est le rôle du facteur de randomisation dans le décodage. En plus lors de la génération de texte, ChatGPT utilise certains paramètres qui influencent la "créativité" et la "variabilité" de ses réponses. Température (Température et Top-p), ce paramètre contrôle le niveau de randomisation dans le choix des mots, une température plus élevée (par exemple, autour de 0,8) donnera des réponses plus diverses et créatives, tandis qu'une température plus basse (proche de 0) rendra les réponses plus prévisibles et répétitives. ChatGPT ajuste ce paramètre pour offrir des réponses qui sont généralement variées, mais cohérentes. Top-p (ou nucleus sampling), ce paramètre limite le choix des mots aux options les plus probables jusqu'à ce qu'une certaine "probabilité cumulative" soit atteinte. En ajustant ce seuil, on permet au modèle de choisir parmi des réponses légèrement différentes, en fonction de la probabilité des tokens.
Ces paramètres de génération permettent à ChatGPT d'éviter les réponses trop répétitives et de maintenir un certain niveau de diversité dans ses réponses. L’influence des tokens précédents est également de mise, même si vous posez la même question, ChatGPT peut avoir une "perception" subtilement différente de la conversation en fonction des réponses précédentes et du contexte accumulé. Cela est particulièrement visible dans des interactions où le modèle peut intégrer implicitement un ton ou un style de conversation basé sur vos questions antérieures.
On a vu précédemment que le modèle GPT est basé sur une architecture de transformers, avec un mécanisme d'attention qui évalue l'importance de chaque token dans le contexte. Ce système d'autoattention peut aussi introduire de légères variations en fonction des subtilités des interactions passées et de la façon dont le modèle "interprète" les relations entre les mots dans votre question. Même si le modèle dispose d’un corpus de connaissances relativement fixe, il reste probabiliste. Ce n'est pas un système qui suit des règles strictes ou "déterministes" (comme une calculatrice, par exemple). ChatGPT génère chaque mot en se basant sur des probabilités, ce qui permet une réponse nouvelle chaque fois, dans les limites de sa cohérence et de ses connaissances, il se nourit des Système de Gestion de Base de Données (SGBD,)
Exemple d’application, imaginons que vous demandiez : "Quelle est la capitale de la France ?" Lors de la première génération, la réponse pourrait être "La capitale de la France est Paris.", dans la génération suivante, le modèle pourrait répondre "Paris est la capitale de la France.", parfois, il peut même ajouter une note contextuelle comme "Paris est bien la capitale de la France, et c'est aussi l'une des villes les plus visitées au monde."
En résumé, ChatGPT est conçu pour produire une variété de réponses qui restent cohérentes, grâce à une combinaison de paramètres de génération, de mécanismes d'attention et d'algorithmes probabilistes. Cela permet d’avoir des interactions plus naturelles, un peu comme si l’on discutait avec une personne qui peut reformuler sa réponse d'une autre manière sans changer le sens fondamental, néanmoins, c’est toujours de brassage de données qu’il s’agit.
Conclusion, cet article suggère que ChatGPT n’a pas de conscience, que l’on ne comprend pas comment la conscience pourrait apparaître d’une manière thaumaturgique (système émergent) dans les équations ou les calculs matriciels, essence des algorithmes. Et venir remettre en question la déraisonnable efficacité des mathématiques dans les sciences de la nature (Eugène Wigner : les mathématiques convenaient presque trop bien à la formulation de lois naturelles).
Ce que ne dit pas l’article, "qu'est-ce que la conscience ? », la conscience est un concept complexe qui a été exploré par les philosophes, les scientifiques et les théologiens depuis des siècles. Il n'y a pas de définition unique et universellement acceptée. On peut citer « C'est la capacité d'un individu à se reconnaître comme un être distinct du monde extérieur, à avoir une expérience subjective du monde et à être conscient de ses propres pensées et sentiments », désolé, cette définition comporte une régression en logique ou circularité. Ou citer « La conscience est souvent associée à un état d'éveil, par opposition au sommeil ou à l'inconscient. C'est la capacité d'être présent et de réagir à son environnement ». Ou encore « La conscience implique également la capacité de juger de la valeur morale de ses actions et de celles des autres. C'est ce qui nous permet de distinguer le bien du mal et de ressentir des émotions telles que la culpabilité ou la fierté. » …
Une I.A. sera-t-elle conscience dans un avenir plus ou moins proche ? Le fonctionnalisme en philosophie de l'esprit soutient que l'état mental d'un système (humain ou artificiel) est défini par sa fonction, c'est-à-dire le rôle qu'il joue dans le système global. Si une IA devenait consciente, cela signifierait qu'un nouveau type d'état mental aurait émergé de son architecture fonctionnelle. Cette émergence serait comparable à l'émergence de la vie à partir de la matière inanimée, ou de la conscience humaine à partir du cerveau. Néanmoins, on ne doit pas perdre de vue que l’essence même d’une I.A. par principe, comme on la vue précédemment, sont les mathématiques. Les mathématiques sont considérées comme un système formel, un ensemble d'axiomes et de règles de déduction. Il est difficile de voir comment un tel système pourrait, par lui-même, engendrer une expérience subjective comme la conscience. La conscience apparaît souvent comme une propriété émergente de systèmes complexes, qui ne peut être entièrement expliquée par la somme de ses parties. Les mathématiques, en tant que système formel, ne semblent pas compatibles avec cette dimension émergente. De ce fait, une I.A. ne peut pas devenir un jour conscient, la conscience semble impliquer une certaine forme d'indétermination et de liberté, ce qui est en contradiction avec le déterminisme strict des systèmes mathématiques.
De Descartes à nos jours, la conscience continue de fasciner et de défier les plus grands penseurs. Un constat qui nous rappelle l'humilité de l'homme, cette quête sans fin nous rappelle la petitesse de l'homme face à l'infinité de l'esprit et à l'immensité de l'univers.
Auteur Gérard Copin pour la tribune libre Agoravox