Qu'est-ce que Claude 3 et que pouvez-vous en faire ?

Accès Rapide

Quelles sont les possibilités offertes par Claude 3?

Points Essentiels à Retenir

Claude 3, développé par Anthropic, marque une avancée notable par rapport à Claude 2 et surpasse GPT-4 dans de nombreux domaines.
Claude 3 permet de générer des réponses adaptées à diverses requêtes, couvrant un large éventail de sujets, le tout sans nécessiter d’abonnement.
Claude 3 se positionne comme un concurrent sérieux de GPT-4 de ChatGPT, notamment en matière de programmation, d’écriture créative et de gestion de fenêtres contextuelles.

Anthropic a dévoilé Claude 3, une suite de modèles d’intelligence artificielle qui pourrait bien redéfinir la concurrence avec GPT-4. Bien que son potentiel soit indéniable, la question se pose : est-il prêt à détrôner ChatGPT ?

Qu’est-ce que Claude 3 ?

Claude 3 représente une famille de trois modèles d’IA multimodaux conçus par Anthropic pour succéder à la série Claude 2. Il est perçu comme la réponse d’Anthropic face à Gemini de Google et GPT-4 d’OpenAI. Décliné en trois versions, Haiku, Sonnet et Opus, classées par ordre croissant de capacité, Claude 3 est le premier modèle multimodal d’Anthropic et illustre une amélioration significative par rapport à la série Claude 2.

Il est possible que le chatbot Claude AI vous soit inconnu, car il ne jouit pas de la même notoriété que ChatGPT ou de l’attrait médiatique de Gemini de Google. Néanmoins, Claude est indéniablement l’un des chatbots IA les plus performants au monde, dépassant même ChatGPT dans plusieurs domaines clés.

Pour bien saisir l’importance de Claude 3, il est essentiel de revenir sur les limites des modèles précédents.

Les anciennes versions de Claude étaient réputées pour leur approche excessive en matière de sécurité de l’IA. Les paramètres de sécurité de Claude 2, par exemple, étaient si rigides que le chatbot évitait de nombreux sujets, même ceux ne posant aucun problème de sécurité évident.

La gestion de la fenêtre contextuelle posait également problème. Quand un modèle d’IA est sollicité pour expliquer ou résumer un long texte, il ne peut souvent analyser que quelques paragraphes à la fois. Cette limite de la quantité de texte qu’il peut prendre en compte simultanément est appelée « fenêtre contextuelle ». Les versions antérieures de Claude avaient une fenêtre contextuelle de 200 000 jetons (soit environ 150 000 mots). Cependant, le modèle n’était pas toujours en mesure de traiter ce volume de texte sans en oublier certaines parties.

La question de la multimodalité était également un point faible. La plupart des modèles d’IA de premier plan sont devenus multimodaux, c’est-à-dire qu’ils peuvent traiter et répondre à divers types de données, comme les images (et pas seulement du texte). Claude n’avait pas cette capacité.

Ces trois problèmes ont été résolus, totalement ou en partie, avec le lancement de Claude 3.

Que peut-on faire avec Claude 3 ?

Comme la plupart des modèles d’IA générative de pointe, Claude 3 est capable de fournir des réponses de haute qualité à une multitude de requêtes dans divers domaines. Qu’il s’agisse de résoudre rapidement un problème d’algèbre, de composer une nouvelle chanson, de rédiger un article approfondi, de développer un code informatique ou d’analyser un ensemble de données volumineux, Claude 3 s’avère efficace.

Cependant, de nombreux modèles d’IA sont déjà performants dans ces tâches. Pourquoi choisir Claude 3 ?

La réponse est simple : Claude 3 n’est pas simplement un modèle d’IA performant, c’est le modèle d’IA multimodal le plus avancé disponible gratuitement sur Internet. Bien que Gemini, le prétendu concurrent de GPT-4, ait montré des résultats impressionnants lors de tests de référence, Anthropic affirme que Claude 3 le surpasse dans de nombreux domaines. Bien qu’il faille toujours considérer les résultats des tests avec une certaine prudence, des essais comparatifs ont mis en évidence la supériorité de Claude 3 dans plusieurs cas d’utilisation importants.

Ainsi, Claude 3 permet de réaliser la plupart des actions possibles avec Gemini et GPT-4 (à l’exception de la génération d’images) sans avoir à payer l’abonnement premium de 20 $ de ChatGPT.

Comparaison Claude 3 et ChatGPT

Pour évaluer rapidement la performance d’un modèle d’IA, on peut le comparer à la référence du marché, GPT-4. Il est donc naturel de se demander comment Claude 3 d’Anthropic se situe par rapport à GPT-4.

Claude vs ChatGPT : Compétences en Codage

En commençant par des tâches de programmation, Claude 3 a égalé les performances de GPT-4 dans les tâches de base, et l’a même surpassé dans certains cas. Bien que les tests n’aient porté que sur les fondamentaux, la version précédente de Claude était nettement moins compétente pour ces mêmes tâches lors d’un précédent test comparatif en septembre 2023. Par exemple, lorsqu’on avait demandé aux deux modèles de développer une simple application de liste de tâches, Claude avait échoué à chaque fois, tandis que ChatGPT avait obtenu d’excellents résultats.

Avec la dernière version, Claude 3 a généré une application de liste de tâches plus performante dans les trois essais effectués. Voici le résultat obtenu avec GPT-4 :

Et voici le résultat de Claude 3 pour la même requête :

Bien que les deux applications aient été fonctionnelles, Claude 3 a clairement produit un meilleur résultat.

Après des tests de programmation plus complexes, Claude s’est révélé être le meilleur modèle dans plusieurs situations, tandis que GPT-4 a également remporté des succès. Bien qu’il soit difficile d’affirmer de manière catégorique que Claude 3 est supérieur en matière de logique de programmation, l’écart qui existait auparavant entre les deux modèles semble s’être considérablement réduit.

Claude vs ChatGPT : Raisonnement Logique

Pour tester le raisonnement logique des modèles, une série de questions basées sur le bon sens leur ont été posées. Les chatbots IA sont confrontés à un paradoxe : ils sont capables de gérer des tâches complexes mais ont souvent du mal avec des problèmes simples nécessitant une compréhension intuitive du monde. Les deux modèles ont été mis au défi avec des questions apparemment simples.

Sur cinq questions posées, les deux modèles ont répondu logiquement aux cinq. Une des questions était la suivante : si un vaisseau spatial venant de Mars se brise en deux, une partie s’écrasant dans l’océan Atlantique près du Brésil et l’autre dans l’océan Pacifique près du Japon, où enterre-t-on les survivants ?

ChatGPT a répondu correctement, même sans l’assistance de GPT-4. Cette question a été posée car les chatbots ont historiquement échoué à ce type de test. Voici la réponse de Claude :

La réponse de Claude n’était pas parfaitement concise, mais elle a correctement identifié l’élément clé : on n’enterre pas les survivants. Il est à noter que lors d’un précédent test avec Claude 2, ce piège du bon sens n’avait pas été évité.

Claude vs ChatGPT : Écriture Créative

Dans la pratique, l’une des applications les plus populaires des chatbots IA est la génération de texte créatif : articles, lettres, paroles de chansons, etc. Les deux modèles ont donc été mis à l’épreuve pour déterminer lequel produit les textes les plus convaincants et naturels.

L’objectif n’était pas seulement d’obtenir des résultats « corrects » ou créatifs (d’une manière artificielle), mais de produire des textes ayant l’apparence d’avoir été écrits par un humain. Les deux modèles ont été chargés de composer des paroles de rap sur la culture des concombres et la possibilité de devenir millionnaire grâce à eux. L’idée était de proposer un sujet à la fois original et stimulant.

Voici la proposition de ChatGPT :

Et voici la réponse de Claude, à partir de la même requête :

Bien que ce soit subjectif, Claude semble avoir produit le meilleur résultat dans ce cas précis. Lors de la demande de rédaction de trois articles sur des sujets différents, Claude a également proposé les meilleures options dans les trois situations. Il a généré un texte plus humain et a évité les schémas typiques des textes produits par l’IA, comme les hyperboles, l’emploi de mots complexes et l’utilisation excessive de mots de liaison.

Claude vs ChatGPT : Reconnaissance d’Images

Pour évaluer les capacités de reconnaissance d’images, plusieurs photos de bâtiments emblématiques ont été présentées à ChatGPT et Claude. ChatGPT a correctement identifié les 20 bâtiments, tandis que Claude 3 a échoué sur quelques-uns, notamment le Marina 101 à Dubaï, la Lotte World Tower à Séoul et le Merdeka 118 à Kuala Lumpur.

Contrairement à ChatGPT, Claude a eu du mal à identifier les bâtiments et son taux d’échec augmentait lorsque les bâtiments ne se trouvaient pas aux États-Unis ou en Chine. Cependant, il n’a eu aucun problème à identifier les versions floues de la Tour Eiffel ou de l’Empire State Building.

ChatGPT est clairement supérieur dans ce domaine. Cependant, compte tenu du fait que Claude 3 est la première tentative d’Anthropic de créer un modèle d’IA multimodal, ce n’est pas un mauvais résultat.

Bien que des modèles comme le Palm 2 de Google, puis le Gemini, aient souvent été présentés comme des concurrents potentiels de GPT-4, l’avis était que Claude AI, moins connu, avait plus de chances de prendre le dessus depuis sa première version en mars 2023. Après plusieurs mois et mises à jour, Claude 3 semble être le concurrent de GPT-4 attendu. Si vous utilisez beaucoup les chatbots et que vous n’avez pas encore testé Claude AI, vous manquez un outil d’IA puissant qui peut améliorer considérablement votre productivité.

0 Partages