NEWS #Digitale : envie de recevoir nos meilleurs articles ?  Inscription → 

On a testé OpenAI o1, le nouveau modèle IA révolutionnaire capable de raisonnements complexes

OpenAI O1, le nouveau modèle IA de la startup américaine promet des capacités inégalées. On l’a testé pour vous. Voici ce que l’on sait à son sujet.

Après le succès de GPT-4, l’entreprise fondée par Sam Altman vient de dévoiler un nouveau modèle d’intelligence artificielle, baptisé o1, capable de « réfléchir » et « raisonner » avant de répondre. Sera-t-il à la hauteur des promesses et pourra-t-il creuser à nouveau l’écart avec la concurrence ? On l’a testé, voici ce que nous savons à son sujet.
OpenAI O1
OpenAI O1

OpenAI O1, un modèle IA capable de « réfléchir »

OpenAI a dévoilé O1, son nouveau modèle qui avait fuité sous le nom de code « Strawberry ».

Après plusieurs années de développement, ce modèle promet de révolutionner le secteur de l’IA en adoptant une approche unique : la capacité à réfléchir avant de répondre.

Contrairement aux modèles actuels qui privilégient la rapidité d’exécution, O1 se distingue des autres par une latence volontaire de quelques secondes à plusieurs dizaines de secondes avant de formuler ses réponses. La latence est variable en fonction de la complexité de la question à analyser et de la réponse à formuler.

Cette réflexion prolongée permettrait une analyse plus fine et plus profonde des requêtes, réduisant ainsi les erreurs et les incompréhensions, un des points faibles des IA actuelles.

Aperçu de GPT-O1 dans ChatGPT
Aperçu de GPT-O1 dans ChatGPT

Déjà disponible pour tous les utilisateurs de ChatGPT Plus, OpenAI a déployé deux variantes de son modèle :

  • o1-preview : pour obtenir des réponses avec les capacités de raisonnement les plus avancées.
  • o1-mini : pour obtenir des réponses avec un raisonnement plus rapide.

Pour le moment, o1 n’est encore capable que de générer et analyser du texte, contrairement à GPT-4 qui peut analyser et générer des réponses multimodales (texte, image, code, …).

On a testé O1 avec 4 questions nécessitant du raisonnement, et les résultats sont très prometteurs

Nous avons réalisé 4 tests différents et tous se sont révélés particulièrement intéressants :

Aperçu de nos deux premiers tests d'OpenAI O1
Aperçu de nos deux premiers tests d’OpenAI O1

Le premier test que nous avons effectué était plutôt « simple », il s’agissait de compter le nombre de lettres « r » dans un mot qui en contenait 4, O1 a parfaitement répondu, et rapidement.

Le second test que nous avons mené portait sur un problème mathématique qui nécessitait un raisonnement par l’absurde, O1 a parfaitement répondu et surtout a détaillé le raisonnement qui l’a conduit à sa réponse.

Aperçu de nos deux derniers tests d'OpenAI O1
Aperçu de nos deux derniers tests d’OpenAI O1

Pour le troisième test, nous avons corsé le test avec une question peu évidente à répondre (« Jennifer répond toujours par oui ou non. Quelle question pourriez-vous poser pour qu’elle se trompe ? »), O1 a fini par planter la première fois… puis trouver la bonne réponse.

Nous avons donc décidé de les tester une quatrième fois avec une dernière question, et, là encore, il a trouvé la bonne réponse en quelques secondes, en expliquant bien son raisonnement.

Des limites pour le lancement

Dans un premier temps, les utilisateurs de ChatGPt Plus ne pourront interroger o1-preview que 30 fois par semaine et o1-mini que 50 fois par semaine.

OpenAI va ensuite progressivement augmenter les limites de ces deux nouveaux modèles et permettra prochainement à son système de chat d’automatiquement choisir le bon modèle en fonction de la question posée.

Le modèle le plus rapide des deux, o1-mini, devrait également être prochainement disponible gratuitement à tous les utilisateurs de la version gratuite de ChatGPT.

De nouveaux modèles accessibles uniquement à certains développeurs par API pour le moment

Seuls les développeurs du tier 5, qui ont dépensé plus de 1000 dollars de crédits OpenAI sur les 30 derniers jours, pourront bénéficier d’un accès anticipé à ces nouveaux modèles, avec certaines limites d’usage pour le moment (20 RPM).

Vers une IA capable d’un raisonnement plus profond

L’une des grandes promesses de o1 réside ainsi dans sa capacité de raisonnement profond, ce qui pourrait le rapprocher de l’idéal de superintelligence, une ambition que poursuit OpenAI depuis sa création.

L’objectif est d’aller au-delà des simples réponses rapides, souvent entachées de ce qu’on appelle des « hallucinations », des réponses incorrectes ou incohérentes fournies par les IA actuelles.

OpenAi O1-preview, avec sa capacité à analyser les problèmes dans leur ensemble avant de donner une réponse, pourrait grandement améliorer la précision des réponses et leur contextualisation.

OpenAI : un leader qui cherche à garder son avance

OpenAI a dominé le marché de l’IA générative depuis la sortie de ChatGPT en novembre 2022, mais cette avance a été de plus en plus contestée par des géants comme Google, Meta, et des start-ups prometteuses telles qu’Anthropic, Mistral ou ou encore xAI d’Elon Musk.

L’enjeu de O1 est donc crucial : il doit permettre à OpenAI de reprendre une longueur d’avance, à un moment où la concurrence commence de plus en plus à lui faire de l’ombre.

D’un point de vue stratégique, ce nouveau modèle s’inscrit également dans le cadre d’un projet plus vaste d’OpenAI : la sortie de GPT-Next, une version améliorée de GPT-4, qui pourrait voir le jour en parallèle de O1.

GPT-Next serait, selon les rumeurs, 100 fois plus puissant que GPT-4, tout en consommant moins de ressources, renforçant ainsi l’écosystème d’OpenAI et offrant des performances inégalées sur le marché.

Avant de se quitter…

Si cet article sur la sortie d’OpenAI O1 vous a plu, n’hésitez pas à le partager sur les réseaux sociaux, à vous abonner à notre newsletter digitale et/ou à nous suivre sur Google Actualités pour recevoir nos prochains articles.

Vous pouvez également suivre nos meilleurs articles via notre flux RSS : https://www.leptidigital.fr/tag/newsletter-digitale/feed/ (il vous suffit de l’insérer dans votre lecteur de flux RSS préféré (ex : Feedly)).

Nous sommes aussi actifs sur LinkedIn, X, Facebook, Threads et YouTube. On s’y retrouve ?

Un avis ? post

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *