NEWS #Digitale : envie de recevoir nos meilleurs articles ?  Inscription → 

Google annonce de nouveaux modèles Gemini 1.5 : plus rapides, moins chers et plus performants

Google vient de dévoiler des nouveautés intéressantes pour ses modèles Gemini 1.5, voici ce qu’il faut retenir de cette annonce.

Google a récemment dévoilé des mises à jour intéressantes de ses modèles d’IA Gemini 1.5, avec la sortie des versions Gemini-1.5-Pro-002 et Gemini-1.5-Flash-002. Ces nouvelles versions promettent des performances améliorées ainsi que des coûts d’utilisation nettement réduits, ce qui devrait plaire aux développeurs et entreprises. Voici ce qu’il faut retenir de cette annonce.
Gemini 1.5 - Google
Gemini 1.5 – Google

1. Des coûts d’utilisation divisés par plus de 2 pour Gemini 1.5 Pro

Google a annoncé une baisse de plus de 50 % des coûts d’utilisation pour le modèle Gemini 1.5 Pro et ses 2 millions de tokens de contexte, avec des réductions sur les tokens d’entrée (-64%) et de sortie (-52%), ainsi que sur les tokens mis en cache pour les prompts de moins de 128K tokens (-64%).

Aperçu des prix de Gemini avant et après la baisse
Aperçu des prix de Gemini avant et après la baisse

Cette réduction, effective à partir du 1er octobre 2024, devrait faciliter l’intégration des modèles avancés d’IA de Google dans des applications et logiciels d’entreprises en réduisant significativement les dépenses associées à leur utilisation.

2. Amélioration des performances et latence réduite

Les nouvelles versions des modèles Gemini offrent des performances doublées en termes de vitesse de sortie, tout en réduisant la latence par trois.

Ces améliorations permettent une exécution plus rapide des tâches, qu’il s’agisse de la compréhension de vidéos longues, de la gestion de gros fichiers PDF, ou de la génération de code à plus grande échelle.

3. Augmentation des limites de requêtes par minute

Pour répondre aux besoins croissants des développeurs, Google a également augmenté les limites de requêtes pour ses modèles.

Le modèle Gemini 1.5 Flash passe de 1 000 à 2 000 requêtes par minute (RPM), tandis que le modèle Pro passe de 360 à 1 000 RPM.

Il sera ainsi désormais de traiter davantage de volumes de données plus rapidement qu’auparavant.

4. Des réponses plus concises

En réponse aux retours des développeurs, les modèles mis à jour produisent désormais des réponses plus concises, avec une réduction de la longueur de sortie d’environ 5 à 20 % pour des cas d’utilisation comme les résumés et les questions-réponses.

Cela aide à réduire les coûts de traitement tout en augmentant l’efficacité.

Pour les utilisateurs souhaitant des réponses plus détaillées, il sera toujours possible d’obtenir ce type de réponses en ajustant les prompts utilisés pour interroger les modèles de Google.

Ces nouvelles version de Gemini seront pour le moment uniquement accessibles via API mais les abonnés à Gemini Advanced pourront prochainement accéder à ces modèles directement depuis l’interface de chat de Gemini lorsque ces derniers auront été adaptés pour ce type de conversations.

Avant de se quitter…

Si cet article sur les nouveautés annoncées par Google pour ses modèles Gemini 1.5 vous a plu, n’hésitez pas à le partager sur les réseaux sociaux, à vous abonner à notre newsletter digitale et/ou à nous suivre sur Google Actualités pour recevoir nos prochains articles.

Vous pouvez également suivre nos meilleurs articles via notre flux RSS : https://www.leptidigital.fr/tag/newsletter-digitale/feed/ (il vous suffit de l’insérer dans votre lecteur de flux RSS préféré (ex : Feedly)).

Nous sommes aussi actifs sur LinkedIn, X, Facebook, Threads et YouTube. On s’y retrouve ?

Un avis ? post

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *