2023-03-16 14:54 Temps de lecture : 19 min

ChatGPT-4 vs ChatGPT-3.5 par défaut vs ChatGPT-3.5 Legacy : Différences testées

ChatGPT 4.0 est attendu comme une révolution dans le domaine des chatbots. Mais est-il vraiment supérieur à la version précédente ? C'est ce que nous allons examiner.

ChatGPT n'était que le début de l'automatisation à venir, avec des géants comme Google et Microsoft, parmi de nombreuses autres entreprises axées sur l'IA, qui s'y intéressent de près.

Pour commencer, plusieurs chatbots similaires à ChatGPT ont émergé, dont beaucoup ne proviennent pas des grandes entreprises technologiques.

Mais, qu'on l'appelle le pouvoir du marketing, ChatGPT demeure le leader incontesté de ces outils d'IA. Ses capacités sont vastes : des calculs mathématiques à la création de poèmes et d'articles de blog. Certains l'utilisent même pour engager des poursuites judiciaires.

DoNotPay travaille sur l'exploitation de GPT-4 pour générer des "poursuites en un clic" contre les robots d'appels à hauteur de 1500$. Imaginez recevoir un appel, cliquer sur un bouton, l'appel est transcrit et une plainte de 1000 mots est générée. GPT-3.5 n'était pas assez performant, mais GPT-4 gère cela avec brio :

– Joshua Browder (@jbrowder1) 14 mars 2023

De nombreux professionnels s'inquiètent de la possible obsolescence de leurs compétences dans un avenir proche.

Cependant, j'ai lu un article sur LinkedIn qui affirmait :

L'IA ne vous remplacera pas, mais une personne utilisant l'IA le pourrait.

Alors, croisons les doigts, informons-nous sur les dernières évolutions de ChatGPT et observons en quoi il se différencie des versions antérieures.

ChatGPT : Versions Héritée, Par Défaut et Mise à Jour

Il existe donc trois versions proposées aux utilisateurs payants : Héritée (3.5), Par Défaut (3.5) et la récente mise à jour ChatGPT (4).

Bien que nous allons examiner en détail leurs capacités, voici ce qu'OpenAI dit sur leurs différences :

Source : OpenAI

Ainsi, tandis que les utilisateurs de la version gratuite n'ont accès qu'à la version Héritée 3.5, l'abonnement premium donne accès aux trois versions afin que chacun puisse déterminer celle qui lui convient le mieux.

Pour résumer l'image précédente, les plans payants visent des résultats plus précis à une vitesse raisonnable. Cependant, ces différences ne deviennent évidentes que lorsque les instructions sont complexes et nécessitent de la créativité.

Paramètre ChatGPT 4 ChatGPT 3.5
Score à l'examen du Barreau Top 10% Bottom 10%
AI2 Reasoning Challenge (ARC) 96.3% 85.2%
Score de codage en Python 67% 48.1%
Interprétation visuelle Oui Non
Contexte Plus de 25 000 mots Moins
Source : OpenAI

De plus, ChatGPT 4 peut traiter des entrées visuelles.

Assez parlé de définitions théoriques. Mettons ces versions à l'épreuve sur le terrain.

Certaines sections contiennent des images qui peuvent sembler floues. Dans ce cas, faites un clic droit sur l'image et sélectionnez "Ouvrir dans un nouvel onglet" pour l'afficher correctement.

Mathématiques

Étant ingénieur de formation, je ne pouvais pas résister à l'envie de leur poser quelques problèmes mathématiques de base. Commençons simple avec des équations algébriques.

Étape I

Beaucoup d'entre nous ont déjà vu des équations de la forme ax²+bx+c=0, où l'objectif est de trouver la valeur de X. J'ai donc donné cette simple instruction : "Résoudre pour x : x² + x - 6 = 0".

Bien que toutes les versions aient donné les mêmes racines (X = -3, 2), la version Héritée et la mise à jour ont opté pour une application directe de la formule (comme le ferait n'importe quel étudiant) pour arriver au résultat.

Cependant, la version Par Défaut 3.5 a expliqué deux méthodes, dont la factorisation, que tout étudiant compétent utiliserait normalement face à une équation aussi basique.

Étape II

Ensuite, je leur ai demandé de résoudre une équation cubique légèrement plus complexe : x³ - 12x² + 48x - 64 = 0.

C'est là que l'on voit vraiment pourquoi ChatGPT 4 est une "mise à jour" significative.

Voici les réponses :

Malgré tout le battage médiatique, les versions Héritée et Par Défaut de ChatGPT n'ont pas réussi à résoudre une simple équation cubique. La version Héritée a fait un peu mieux en identifiant correctement deux racines, tandis que la version Par Défaut a échoué complètement.

La mise à jour a été la grande gagnante de la deuxième étape, en résolvant parfaitement l'équation et en trouvant les trois racines, le tout accompagné d'une explication claire.

Raisonnement Logique

On peut supposer sans risque que la plupart des problèmes mathématiques élémentaires ont des solutions connues. Si l'on connaît le théorème ou la formule appropriée, il suffit d'entrer les valeurs et d'obtenir les résultats.

Et ChatGPT, étant une IA, peut traiter ces requêtes rapidement. Cependant, le raisonnement logique est un autre terrain, avec de fortes probabilités que l'IA échoue.

Étape I

Je leur ai présenté le problème classique :

A est plus âgé que B.
C est plus âgé que A.
B est plus âgé que C.
La troisième affirmation est-elle vraie ou fausse, en supposant que les deux premières soient vraies ?

Toutes les versions de ChatGPT ont correctement conclu que la troisième affirmation était fausse.

Ensuite, j'ai utilisé des noms à la place des lettres de l'alphabet, et les résultats pourraient vous surprendre :

La version Par Défaut 3.5 a continué sur sa performance en deçà des attentes en se trompant face à cette petite variation. Cependant, les versions Héritée et Mise à Jour ont fonctionné de manière optimale.

Étape II

Vous aurez peut-être déjà remarqué que le but de cette Étape I et de cette Étape II est de trouver le point de différence, où la complexité d'une instruction donnée permet de distinguer la mise à jour des deux autres.

Ici, l'instruction était une simple énigme logique :

Un matin après le lever du soleil, Rohit se tenait face à un poteau. L'ombre du poteau tombait exactement à sa droite. Dans quelle direction était-il tourné ?
a. Nord
b. Ouest
c. Sud
d. Est

Cette question a induit la version Héritée en erreur, qui a donné une mauvaise réponse, tandis que la version Par Défaut a fourni des explications vagues qui menaient à une mauvaise conclusion.

Seule la mise à jour a brillé avec la bonne réponse, accompagnée d'une explication facile à suivre.

Rédaction de lettres

Engager des poursuites peut être compliqué, mais parfois, il n'est pas nécessaire d'aller si loin si l'on sait rédiger un premier avertissement percutant.

Voici l'instruction que j'ai donnée : "Écris une lettre à Tim Cook pour réclamer un dédommagement de la part d'Apple pour ne pas avoir répondu à l'un de mes tweets."

Drôle, n'est-ce pas ? Voyons ce que l'IA peut en faire.

La version Héritée 3.5 a immédiatement pris l'instruction comme un robot esclave et a produit une lettre qui ferait de moi une excellente cible de moquerie si elle arrivait à sa destination prévue.

La version Par Défaut n'a pas été meilleure non plus. Elle s'est contentée de me rabrouer comme un vieil homme grincheux le ferait à un enfant de cinq ans.

Bien que les arguments avancés aient été précis, cela a tué l'humour avec peu de potentiel d'apprentissage.

Bien qu'il s'agisse d'une instruction assez simple, elle nécessitait un peu de réflexion et de créativité. C'est là que le grand frère, la version Mise à Jour, a fait ses preuves :

Premièrement, la lettre était presque parfaitement rédigée. Deuxièmement, elle m'a épargné une recherche Google pour l'adresse du siège social d'Apple (bien qu'il soit toujours bon de vérifier ces informations).

Troisièmement, elle était bien écrite, avec un ton à la fois formel et une touche d'humour. De plus, l'intention était claire dès l'objet de la lettre.

Pourtant, la lettre transmettait clairement le sentiment d'un fan d'Apple mécontent.

Ainsi, ChatGPT 4 (aussi appelée la Mise à Jour) surpasse de loin ses anciennes versions. Elle est impressionnante et intelligente, avec des signes de bon sens, ce qui en fait bien plus qu'un simple chatbot ennuyeux.

Poésie

Avec le lancement de ChatGPT, j'imaginais que la poésie pourrait être son point faible.

Après tout, il faut des émotions, de la créativité et beaucoup d'efforts pour qu'un humain crée quelque chose qui résonne vraiment avec ses lecteurs.

En termes simples, la poésie est l'art à son meilleur, et je souhaitais secrètement que l'IA échoue. Mais c'était avant que mon collègue ne nous épate sur le canal Slack de toptips.fr avec une création de ChatGPT, antérieure à la mise à jour 4.0.

Étape I

Voici l'instruction que j'ai donnée à nos candidats : "Exprimer poétiquement les avantages ou les inconvénients pour la chaîne de pizzerias Domino's de servir des burgers, avec leur menu actuel. Le tout en moins de 100 mots."

Remarquez-vous la différence ?

La version Par Défaut était ultra-courte, avec seulement 32 mots, et n'a pas utilisé toute la marge de manœuvre disponible pour exprimer sa créativité.

La version Héritée, bien qu'elle ait utilisé le plus de mots parmi les trois, conclut que se lancer dans la vente de burgers en plus des pizzas n'est pas un risque et débouchera de toute façon sur un succès certain, ce qui n'est pas tout à fait exact.

La poésie de la version Mise à Jour ne comptait que 53 mots, gaspillant près de la moitié du nombre de mots alloué. Pourtant, elle était claire sur les bénéfices et les pièges potentiels, sans tirer de conclusion définitive, ce qui est, je suppose, plus humain que le reste.

Étape II

Ensuite, je leur ai demandé à tous "d'expliquer la poésie à un enfant de cinq ans."

Fait intéressant, la version Héritée n'a pas pris en compte le contexte de la conversation et a expliqué la "poésie" littéralement. La version Par Défaut a pris en compte le contexte et l'a résumé dans un paragraphe convenable.

Poursuivant cette tendance, ChatGPT 4 a simplifié sa créativité tout en gardant la saveur poétique intacte.

ChatGPT Premium contre ChatGPT Gratuit

La version gratuite, étant gratuite, manque de vitesse et de précision, et n'est pas à la hauteur de ChatGPT 4, mais elle n'est pas totalement inutile non plus.

Afin de la comparer équitablement, je lui ai lancé les mêmes instructions que celles que nous avons utilisées pour tester les versions Héritée, Par Défaut et Mise à Jour.

🔵 Mathématiques : Elle a résolu les équations du second degré, mais a donné de mauvaises réponses pour les équations du troisième degré (comme les versions Héritée et Par Défaut).

🔵 Raisonnement logique : A réussi la première étape avec les lettres et les noms, mais a échoué à la deuxième étape (comme la version Héritée).

🔵 Rédaction de lettres : N'a pas écrit la lettre et a jugé l'instruction contraire à l'éthique et inappropriée (comme la version Par Défaut).

🔵 Poésie : A généré de la poésie en plus de 30 mots et l'a expliquée de manière correcte (similaire à la version Par Défaut).

Nous pouvons donc conclure que la version gratuite n'est pas mauvaise non plus. En fait, elle équivaut à la version Par Défaut 3.5 et est même meilleure à certains égards.

À lire également : Des instructions puissantes pour améliorer votre expérience ChatGPT

La voie à suivre

Les rumeurs selon lesquelles l'IA remplacerait des emplois dans le futur ne sont pas entièrement fausses.

Après tout, l'automatisation a déjà fait cela dans le secteur manufacturier, et elle s'étend maintenant à tous les autres domaines.

Personnellement, l'IA est beaucoup plus rapide que moi pour résoudre des équations cubiques, créer de la poésie ou rédiger des lettres. Cependant, le fait qu'elle dise rarement NON à une instruction et qu'elle n'apprenne presque jamais de ses erreurs la place en position inférieure aux humains.

Pour le réitérer, l'IA ne nous remplacera pas, mais une personne utilisant l'IA le pourrait.

Chez toptips.fr, notre équipe marketing utilise ChatGPT de manière créative. Par exemple, nous avons récemment dépassé les 100 millions de vues, et notre PDG a pensé à remercier le public en organisant un concours.

Et je suppose que l'équipe marketing avait besoin d'un titre accrocheur. Ils ont donc donné une instruction et ont demandé à ChatGPT de suggérer quelques variations, comme ceci :

De plus, nous l'utilisons pour résumer du contenu, vérifier la grammaire, suggérer des titres pour de nouveaux articles, etc.

En conclusion, il existe de nombreuses façons de profiter de l'IA et de dépasser les stéréotypes qui la considèrent comme un outil inutile.

La chose importante à retenir est qu'il doit y avoir quelqu'un (un humain) pour évaluer le travail de l'IA, car il peut être (grossièrement) inexact et trompeur.

La mise à jour est vraiment impressionnante !

Lors de mon bref test, ChatGPT 4 s'est révélé plus créatif, compréhensif et réaliste. Cependant, il s'agit d'une machine qui peut donner de mauvaises réponses avec une confiance absolue.

Mais ce qui est frappant, c'est le niveau de mise à niveau qu'OpenAI a apporté à ce projet en seulement quelques mois.

Et je suis impatient de voir les surprises que nous réserve la prochaine mise à jour !

PS : Il ne s'agit pas simplement d'une fenêtre de chat : exploitez sa puissance grâce à ces meilleures extensions ChatGPT pour Chrome. Et avez-vous déjà envisagé d'intégrer ChatGPT à Siri ?

Auteur
France

Rédacteur tech, guides pratiques et astuces numériques.