
Le premier exposant lancé par Google est Gemini 2.5 Pro Experimental (nom de code nebula), qui, sans surprise, est déjà en tête du classement Chatbot Arena . Le modèle, conçu pour des tâches complexes, présente de solides capacités de raisonnement et de programmation, surpassant les solutions OpenAI, Claude et xAI dans les benchmarks mathématiques (AIME 2025) et scientifiques (GPQA diamant). Le modèle dispose d'une fenêtre contextuelle d' un million de jetons (Google a déjà promis une mise à jour pour la porter à 2 millions) et peut comprendre de grands ensembles de données et gérer des problèmes complexes à partir de plusieurs sources d'informations, notamment du texte, de l'audio, des images, des vidéos et même des archives de code entières.
De toute évidence, l’un des principaux objectifs de Google (ainsi que de ses concurrents) est de développer des modèles qui peuvent mieux aider les développeurs dans leur travail. Selon Google, Gemini 2.5 Pro représente une grande amélioration par rapport à 2.0, en particulier dans la création d'applications Web visuellement attrayantes et d'applications de code agentif , ainsi que dans la transformation et l'édition de code. Comme nous l'avons vu précédemment, le Gemini 2.5 Pro obtient un score solide de 63,8 % dans SWE-Bench Verified avec « une configuration d'agent personnalisée », et BigG promet « plus d'améliorations » à l'avenir. Gemini 2.5 Pro Experimental est désormais disponible sur l'application Gemini (où il remplace Gemini 2.0 Pro Experimental, lancé le mois dernier) pour les abonnés Gemini Advanced et sur Google AI Studio . Bientôt disponible sur Vertex AI également.
Envoyer une nouvelle à un ami