Anthropic dévoile une mise à jour majeure de son modèle Claude 3.5 Sonnet et annonce un nouveau modèle Claude 3.5 Haiku. Découvrez leurs particularités !
Anthropic dévoile une mise à jour majeure de son modèle Claude 3.5 Sonnet et annonce un nouveau modèle Claude 3.5 Haiku. Découvrez leurs particularités !
Claude 3.5 Sonnet, le modèle phare d’Anthropic, franchit un cap avec une nouvelle mise à jour permettant de naviguer, cliquer, faire défiler des pages, remplir des formulaires, gérer des tableaux de données, automatiser des tâches répétitives, de manière autonome, sur un ordinateur.
Dans la vidéo ci-dessous, vous pourrez découvrir un exemple de remplissage de formulaire automatique avec cette nouvelle fonctionnalité. À noter que le tableur et le formulaire sont déjà ouverts sur l’ordinateur. Il semble que le modèle ne puisse pas encore trouver seul les informations nécessaires pour effectuer la tâche.
De plus, on remarque une certaine latence dans l’exécution de la tâche. N’irions pas plus vite en le faisant nous-même ? À vous d’en juger :
Bien que cette fonctionnalité soit accessible en bêta publique par API sur les plateformes comme Amazon Bedrock et Google Cloud’s Vertex AI, elle est encore en cours de développement. Par exemple, certaines actions comme le défilement ou le zoom ne sont pas tout à fait juste.
Anthropic rend disponible son modèle mis à jour pour recueillir le maximum de retours pour le perfectionner.
Cette autre vidéo, réalisée par Shubham Sharma, vous présente un aperçu plus détaillé de cette nouveauté et comment l’installer de votre côté :
Des entreprises comme Replit et The Browser Company ont déjà commencé à l’expérimenter.
Replit, par exemple, utilise Claude 3.5 pour développer une fonctionnalité qui permet d’évaluer des applications en cours de développement. Cela nécessite souvent des dizaines, voire des centaines d’actions à réaliser manuellement—une tâche idéale pour Claude 3.5 Sonnet, capable d’automatiser ce processus.
Les secteurs du support client, de la programmation, et même des tests logiciels pourraient y avoir recours pour réduire le temps attribué sur des tâches répétitives et/ou complexes.
La nouvelle version Claude 3.5 Sonnet a également augmenté ses performances de précision sur les tâches en codage. Sur SWE-bench Verified, il passe de 33,4% à 49%, soit un score supérieur à tous les modèles disponibles au public, y compris OpenAI o1-preview.
GitLab, qui a testé le modèle pour les tâches DevSecOps, a constaté que le modèle raisonnait beaucoup mieux qu’auparavant sans latence supplémentaire.
De plus, Cognition l’utilise également pour les évaluations d’IA autonomes et a constaté des améliorations sur le codage, la planification et la résolution de problèmes par rapport à la version précédente.
Si les perspectives offertes par Claude 3.5 Sonnet sont prometteuses, le fait de donner à une IA la capacité de contrôler un ordinateur soulève des questions sur les risques potentiels.
Pour les anticiper, Anthropic a mis en place des classificateurs de sécurité capables de détecter des comportements inhabituels ou dangereux ainsi que des partenariats avec des institutions comme l’US AI Safety Institute et l’UK Safety Institute qui ont permis de tester ces modèles avant leur déploiement.
En parallèle de Claude 3.5 Sonnet, Anthropic a dévoilé son modèle Claude 3.5 Haiku, un autre modèle performant, mais plus orienté vers la rapidité et l’efficacité.
Destiné à des applications nécessitant des réponses rapides et précises, Claude 3.5 Haiku surpasse son prédécesseur Claude 3 Haiku dans presque toutes les tâches, y compris la programmation, avec un score impressionnant de 40,6% sur SWE-bench Verified.
Ce modèle est idéal pour des tâches nécessitant une interaction directe avec les utilisateurs, comme des chatbots ou des agents virtuels. Il sera disponible dans les prochaines semaines via l’API.
Avec ces modèles, Anthropic affirme que les IA ne seront plus simplement des outils de traitement de données mais de véritables assistants capables de naviguer sur nos ordinateurs et d’interagir avec nos logiciels.
Pour le moment, les capacités ne sont pas encore au rendez-vous, mais devraient l’être d’ici les prochains mois. À suivre…
Avez-vous tester l’un de ces modèles ? Dites-nous en commentaire !
Avant de se quitter…
Si cet article sur la mise à jour du modèle Claude 3.5 Sonnet vous a plu, n’hésitez pas à le partager sur les réseaux sociaux, à vous abonner à notre newsletter digitale et/ou à nous suivre sur Google Actualités pour recevoir nos prochains articles.
Vous pouvez également suivre nos meilleurs articles via notre flux RSS : https://www.leptidigital.fr/tag/newsletter-digitale/feed/ (il vous suffit de l’insérer dans votre lecteur de flux RSS préféré (ex : Feedly)).
Nous sommes aussi actifs sur LinkedIn, X, Facebook, Threads et YouTube. On s’y retrouve ?
Anciennement E-Store Manager et Social Media Manager en agence et chez l’annonceur, je m’intéresse principalement aux sujets liés au Community Management, au Social Media Advertising et au E-commerce au sens large. Je suis aussi toujours à l’affût des dernières tendances webmarketing et couvre ces sujets pour LEPTIDIGITAL. Pour me contacter : [email protected]