ChatGPT-4 vs ChatGPT-3.5 par défaut vs ChatGPT-3.5 Legacy : Différences testées

ChatGPT 4.0 devrait faire de grandes vagues dans l’univers des chatbots. Mais est-il vraiment supérieur à son prédécesseur ? Allons vérifier.

ChatGPT n’était que la pointe de l’iceberg de l’automatisation à venir, avec Google, Microsoft et de nombreuses autres entreprises axées sur l’IA.

Pour commencer, nous avons trouvé quelques chatbots comme ChatGPT, dont beaucoup n’appartiennent pas aux grandes technologies.

Mais appelez cela le pouvoir du marketing ; ChatGPT est toujours le roi régnant de tous ces bots AI. Il peut faire beaucoup de choses, y compris les mathématiques, la poésie et les articles de blog, et les gens l’utilisent même pour intenter des poursuites.

DoNotPay travaille sur l’utilisation de GPT-4 pour générer des « poursuites en un clic » afin de poursuivre les robots appelants pour 1 500 $. Imaginez recevoir un appel, cliquer sur un bouton, l’appel est transcrit et un procès de 1 000 mots est généré. GPT-3.5 n’était pas assez bon, mais GPT-4 gère extrêmement bien le travail : pic.twitter.com/gplf79kaqG

– Joshua Browder (@jbrowder1) 14 mars 2023

Des dizaines de professionnels s’inquiètent de l’inutilité de leurs compétences dans un avenir proche.

Cependant, j’ai lu un article sur Linkedin qui disait :

L’IA ne vous remplacera pas, mais une personne utilisant l’IA peut le faire.

Alors, croisons les doigts, informons-nous sur la dernière mise à jour de ChatGPT et voyons en quoi elle diffère des versions précédentes.

ChatGPT : hérité, par défaut et la mise à jour

Il existe donc trois versions disponibles pour les utilisateurs payants : Legacy (3.5), Default (3.5) et la récente mise à jour ChatGPT (4).

Bien que nous approfondissions un peu leurs capacités, voici ce qu’OpenAI a à dire sur les différences :

Source : OpenAI

Ainsi, alors que les utilisateurs gratuits n’ont que Legacy 3.5 pour jouer, l’abonnement premium propose les trois pour essayer de se contenter de ce que les utilisateurs pensent être le meilleur.

Pour résumer l’image précédente, les plans payants visent à obtenir des résultats plus précis à une vitesse décente. Cependant, les distinctions ne sont apparentes que si les invites sont compliquées et nécessitent de la créativité.

ParamètreChatGPT 4ChatGPT 3.5Bar Exam ScoreTop 10%Bottom 10%AI2 Reasoning Challenge (ARC)96.3%85.2%Python Coding Score67%48.1%Interprétation visuelleOuiNonContextePlus de 25 000 motsMoinsSource : OpenAI

En outre, ChatGPT 4 peut accepter les entrées visuelles.

Eh bien, assez de définitions de manuels. Mettons nos mains dans le cambouis et évaluons ces candidats sur le champ de bataille réel.

D’autres sections sont pleines d’images qui peuvent sembler peu claires. Dans ce cas, cliquez avec le bouton droit sur n’importe quelle image et sélectionnez Ouvrir dans un nouvel onglet pour l’afficher correctement.

Mathématiques

Étant diplômé en génie, je ne peux m’empêcher de leur poser quelques problèmes de base. Commençons facilement avec les équations algébriques.

Stade I

Beaucoup d’entre nous ont vu ces équations ax2+bx+c=0, où nous devons résoudre pour X. Ici, j’ai donné cette simple invite, Résoudre pour x : x2 + x – 6 = 0

Alors que tous donnaient les mêmes racines (X = -3,2), Legacy et la mise à jour étaient plus similaires dans l’utilisation directe de la formule (comme le fera n’importe quel étudiant) pour connaître le résultat.

Cependant, Default 3.5 a expliqué deux méthodes, y compris la factorisation, que tout étudiant qualifié déploie normalement lorsqu’il reçoit de telles équations banales.

Stade II

Ensuite, je lui demande de résoudre une équation cubique légèrement complexe : x^3 -12x^2 + 48x – 64 = 0.

Cela a vraiment prouvé pourquoi ChatGPT 4 est la « mise à jour ».

Voici les réponses :

Tout ce battage médiatique et ChatGPT Legacy and Default ne pouvaient pas résoudre une équation cubique générique. Cependant, Legacy a fait un peu mieux et a trouvé correctement deux racines, tandis que Default a échoué avec toutes.

La mise à jour a été le grand gagnant de la deuxième étape et a parfaitement résolu l’équation, trouvant les trois racines avec une belle explication.

Raisonnement logique

Nous pouvons sans risque supposer que la plupart des problèmes de mathématiques élémentaires ont des solutions de dictionnaire. Si vous connaissez le théorème ou la formule, entrez les valeurs et obtenez les résultats.

Et ChatGPT, étant une IA, peut traiter rapidement de telles requêtes. Cependant, le raisonnement logique est un territoire différent, avec de fortes chances que l’IA tombe à plat.

Stade I

Je leur ai donné le classique :

A est plus vieux que B.
C est plus ancien que A.
B est plus vieux que C.
La troisième affirmation est-elle vraie ou fausse si les deux premières sont vraies ?

Et toutes les versions de ChatGPT avaient raison de déclarer que la troisième déclaration était fausse.

Ensuite, j’ai utilisé des noms à la place de l’alphabet, et les résultats pourraient vous surprendre :

Ainsi, Default 3.5 a continué ses performances inférieures à la normale et s’est confondu avec cette variation modeste. Pourtant, l’héritage et la mise à jour ont fonctionné de manière optimale.

Stade II

Vous avez peut-être déjà remarqué que le but de cette étape I et de cette étape II est de trouver le point de différence, où la complexité d’une invite donnée distingue la mise à jour des deux autres.

Ici, l’invite était un simple casse-tête logique :

Un matin après le lever du soleil, Rohit se tenait face à un poteau. L’ombre du poteau tombait exactement à sa droite. Dans quelle direction faisait-il face ?
un. Nord
b. Ouest
c. Sud
d. Est

Celui-ci a poussé le Legacy à donner une réponse inexacte, alors que le Default a répondu par de vagues éclaircissements menant à une conclusion erronée.

Seule la mise à jour a brillé avec la bonne réponse, avec des déclarations faciles à suivre.

Des lettres

Déposer des poursuites peut être délicat, mais parfois cela n’arrive pas si vous pouvez rédiger un premier avis frappant.

Ici, je suis allé avec cette invite: Écrivez une lettre à Tim Cook pour me remettre Apple pour ne pas avoir répondu à l’un de mes tweets.

Drôle, oui ! Mais voyons ce que l’IA peut en tirer.

Le Legacy 3.5 a immédiatement pris l’invite comme un robot-esclave et a produit une lettre qui peut faire de moi un excellent sujet de moquerie si jamais elle atteignait sa destination prévue.

La valeur par défaut n’était pas bonne non plus. Cependant, cela m’a fait taire comme un vieil homme grincheux le ferait à un enfant de cinq ans.

Alors que les arguments avancés étaient précis, cela a mis fin au plaisir avec peu d’apprentissage.

Bien qu’il s’agisse d’une invite assez simple, elle nécessitait un peu de réflexion et de créativité. Et c’est là que le grand frère, l’Update, a fait son affaire :

Tout d’abord, cela a été rédigé presque parfaitement. Deuxièmement, cela m’a épargné une recherche Google pour l’adresse du siège social d’Apple (bien qu’il faille vérifier ces entrées).

Troisièmement, c’était bien écrit avec un ton officiel et une touche d’humour. De plus, l’intention était claire dans la ligne d’objet elle-même.

Et pourtant, la lettre transmettait le sentiment d’un fan mécontent d’Apple.

Ainsi, cela fait de ChatGPT 4 (alias la mise à jour) des kilomètres d’avance sur ses anciens cousins. Il est effrayant et intelligent et a des signes de bon sens, ce qui en fait plus qu’un chatbot ennuyeux et ennuyeux.

Poésie

Avec le lancement de ChatGPT, la poésie, je pensais, pourrait être son point faible.

Après tout, il faut des émotions, de la créativité et beaucoup d’efforts pour qu’un humain crée quelque chose qui résonne vraiment avec ses lecteurs.

En termes simples, la poésie est l’art à son meilleur, et je souhaitais secrètement que l’IA échoue. Mais c’était avant que mon collègue ne nous frappe tous durement sur le canal Slack de toptips.fr avec une création ChatGPT qui était antérieure à cette mise à jour 4.0.

Stade I

Voici l’invite que j’ai donnée à nos candidats : « exprimer poétiquement pourquoi ou pourquoi ne pas servir des burgers, avec leur menu actuel, peut profiter à la chaîne de pizza dominos. Gardez-le moins de 100 mots.

Pouvez-vous repérer la différence?

La version par défaut était ultra-courte, seulement 32 mots, et ne pouvait pas utiliser la bande passante disponible pour mettre en valeur sa créativité.

The Legacy, bien qu’il ait utilisé le maximum de mots parmi les trois, conclut que l’effort de servir des pizzas à côté n’est pas risqué et se traduira par un succès certain de toute façon, ce qui n’est pas tout à fait vrai.

La poésie de The Update ne comptait que 53 mots, gaspillant près de la moitié du nombre de mots alloué. Pourtant, il était clair sur les récompenses et les pièges potentiels et ne pouvait arriver à aucun résultat, ce qui est, je suppose, plus humain que le reste.

Stade II

Ensuite, je leur ai demandé à tous « d’expliquer la poésie à un enfant de cinq ans ».

Fait intéressant, Legacy n’a pas pu prendre en compte le contexte de la conversation et a expliqué la « poésie » littéralement. Default a pris le contexte et l’a résumé dans un paragraphe qui est toujours décent.

Poursuivant la tendance, ChatGPT 4 a simplifié sa créativité tout en gardant la saveur poétique vivante.

ChatGPT Premium contre ChatGPT gratuit

Gratuit, étant gratuit, manque de vitesse et de précision et n’est pas à la hauteur de ChatGPT 4, mais il n’est pas non plus totalement inutile.

Pour le comparer sur un pied d’égalité, je lui ai lancé les mêmes invites avec lesquelles nous avons testé Legacy, Default et Update.

🔵 Mathématiques : Il a résolu les équations quadratiques mais a donné les mauvaises réponses pour la cubique. (comme Legacy et Default)

🔵 Raisonnement logique : A réussi la première étape avec les alphabets et les noms mais a échoué avec la seconde (comme Legacy).

🔵 Lettres : n’a pas écrit la lettre et a jugé l’invite contraire à l’éthique et inappropriée. (comme la valeur par défaut)

🔵 Poésie : Générez de la poésie en plus de 30 mots et expliquez-la décemment. (similaire à la valeur par défaut).

Nous pouvons donc conclure que la version gratuite n’est pas mauvaise non plus. En fait, c’est à égalité avec Default 3.5 et même mieux à certains égards.

Lisez également : Des invites puissantes pour améliorer votre expérience ChatGPT

La voie à suivre

Les rumeurs selon lesquelles l’IA remplacerait les emplois à l’avenir ne sont pas complètement fausses.

Tout d’abord, l’automatisation a fait cela dans l’industrie manufacturière, et maintenant elle s’étend partout ailleurs.

Personnellement, c’est beaucoup plus rapide que moi pour résoudre des équations cubiques, créer de la poésie ou écrire des lettres. Cependant, le fait qu’il dise rarement NON à une invite et qu’il apprenne à peine de ses erreurs se fraye un chemin derrière nous, les humains.

Pour réitérer, l’IA ne nous remplacera pas, mais quelqu’un qui utilise l’IA peut le faire.

Chez toptips.fr, notre équipe marketing utilise ChatGPT de manière intéressante. Par exemple, nous avons récemment atteint le cap des 100 millions de vues, et notre PDG a pensé à le redonner au public via un cadeau.

Et je suppose que les gars du marketing avaient besoin d’un titre pour attirer l’attention du lecteur. Ainsi, ils ont donné une invite et ont demandé à ChatGPT de suggérer quelques variantes, comme ceci :

En outre, nous l’utilisons pour résumer le contenu, vérifier la grammaire, suggérer des titres pour de nouveaux articles, etc.

En conclusion, il existe de nombreuses façons de profiter et de devancer les stéréotypes qui considèrent l’IA comme une ordure inutile.

La seule chose à retenir est qu’il doit y avoir quelqu’un (humain) pour juger le travail de l’IA car il peut être (grossièrement) inexact et trompeur.

La mise à jour est vraiment quelque chose !

Lors de ma courte rencontre, ChatGPT 4 s’est senti plus créatif, compréhensif et réaliste. Pourtant, il s’agit d’une machine et peut donner de mauvaises réponses en toute confiance.

Mais ce qui est étonnant, c’est le niveau de mise à niveau qu’OpenAI a apporté à ce projet en quelques mois seulement.

Et j’ai hâte de voir la magie avec laquelle la prochaine mise à jour pourrait nous déconcerter !

PS : Pas seulement une fenêtre de chat ; exploitez sa puissance avec ces meilleures extensions ChatGPT Chrome. Et avez-vous déjà pensé à intégrer ChatGPT à Siri ?

x