Scannez pour télécharger l’application Gate

Autres options de téléchargement

Ne pas rappeler aujourd’hui

Gemini 3 attaque en pleine nuit : surpasse GPT 5.1, l'ère des grands modèles de Google est arrivée

DeepFlowTech

2025-11-19 01:35:34

Gemini 3 n'est pas encore arrivé, Twitter s'est d'abord effondré par respect.

Aucune publication de modèle n'a suscité autant d'attention que Gemini 3. Selon la fréquence de mise à jour de Gemini tous les 3 mois, la communauté AI attend avec impatience Gemini 3 depuis septembre.

Aujourd'hui, la responsable des relations développeurs de Google et responsable de Google AI Studio a publié un tweet ne contenant qu'un seul mot : « Gemini ». Des mois d'attente ont enfin atteint leur point de rupture, et le sujet connexe sur Twitter a instantanément explosé.

Il est intéressant de noter qu'à l'approche de la publication du nœud, Twitter a en fait “coïncidence” planté plusieurs fois. Bien que le “coupable” soit Cloudflare, le timing de ces pannes est si précis qu'il est difficile de ne pas soupçonner qu'il y a quelqu'un derrière tout cela (chuchotement : après tout, Twitter est le principal terrain de promotion pour les modèles de toutes les entreprises).

Je ne sais pas ce que pense Musk, qui vient de publier Grok 4.1 ce matin, mais en tout cas, les mèmes des internautes sont partout.

Juste maintenant, Gemini 3 fait enfin son apparition officielle. Voyons à quel point il est puissant sous le regard de tous.

Le modèle le plus intelligent

Il s'avère que Google n'a pas déçu ceux qui attendaient, Gemini 3 est officiellement lancé, redéfinissant encore une fois l'état de l'art, Ultraman et Musk ont également envoyé leurs félicitations.

Google le définit comme « un pas important vers l'AGI », soulignant qu'il s'agit de l'agent avec la plus forte capacité de compréhension multimodale et la plus profonde interaction au monde actuellement.

Gemini 3 non seulement a renouvelé les normes SOTA en matière de capacités de raisonnement de base, mais a également tenté de redéfinir l'écosystème des développeurs et l'expérience assistée par IA grâce au lancement de la nouvelle plateforme Google Antigravity et du mode Deep Think.

Monstre de raisonnement dominant sur tous les tableaux

Le Gemini 3 Pro est officiellement qualifié de « modèle de raisonnement le plus avancé », surpassant de manière significative la génération précédente, le Gemini 2.5 Pro, dans presque tous les tests de référence AI majeurs, et dominant également des concurrents principaux tels que le Claude Sonnet 4.5 et le GPT-5.1.

Gemini 3 Pro a atteint un score exceptionnel de 1501 Elo, se classant au sommet du LMArena Leaderboard. Il a obtenu les meilleurs scores dans Humanity’s Last Exam (37,5 % sans utiliser d'outils) et GPQA Diamond (91,9 %), démontrant des capacités de raisonnement de niveau doctoral. Il a également établi de nouvelles normes pour les modèles de pointe dans le domaine des mathématiques, atteignant un niveau SOTA de 23,4 % sur MathArena Apex.

En plus du texte et de la logique, Gemini 3 Pro redéfinit également les limites du raisonnement multimodal. Il a obtenu des scores élevés de 81% et 87,6% sur MMMU-Pro et Video-MMMU respectivement, ce qui signifie qu'il excelle tant dans l'analyse de graphiques scientifiques complexes que dans la compréhension de flux vidéo dynamiques.

Il convient de mentionner qu'il a obtenu un score de 72,1 % sur SimpleQA Verified, montrant un énorme progrès en matière d'exactitude factuelle - il est non seulement puissant, mais aussi fiable.

Un partenaire de pensée qui refuse les flatteries

L'évolution du Gemini 3 Pro ne réside pas seulement dans ses performances, mais aussi dans la qualité de l'interaction. Il abandonne les clichés et les louanges excessives souvent associés à l'IA, devenant intelligent, concis et direct : il vous dit ce que vous devez entendre, et pas seulement ce que vous aimez entendre.

Il agit comme un véritable partenaire de réflexion, vous offrant de nouvelles façons de comprendre l'information et de vous exprimer, de la traduction de concepts scientifiques obscurs à travers la génération de code visuel haute fidélité, à la créativité lors de sessions de remue-méninges.

Gemini 3 Deep Think

Le mode Deep Think de Gemini 3 élargit encore les frontières de l'intelligence, apportant des avancées significatives dans les capacités de raisonnement et de compréhension multimodale de Gemini 3, vous aidant à résoudre des problèmes plus complexes.

Dans les tests, Gemini 3 Deep Think a surpassé les performances déjà remarquables de Gemini 3 Pro dans l'examen final de l'humanité (41,0 % sans utiliser d'outils) et GPQA Diamond (93,8 %). De plus, il a également obtenu un score sans précédent de 45,1 % sur ARC-AGI-2 (exécution de code, vérifié par le prix ARC), montrant sa capacité à relever de nouveaux défis.

Le mode Gemini 3 Deep Think excelle dans certains des tests de référence en IA les plus difficiles.

Apprendre, construire et planifier

Apprendre n'importe quoi

Gemini a été conçu dès le départ pour intégrer de manière transparente des informations multimodales sur n'importe quel sujet, y compris du texte, des images, des vidéos, de l'audio et du code. Gemini 3 combine ses capacités avancées de raisonnement, de compréhension visuelle et spatiale, ses performances multilingues de premier plan ainsi qu'une fenêtre contextuelle de millions de tokens, élargissant encore les limites du raisonnement multimodal, vous aidant à apprendre de la manière qui vous convient le mieux.

Par exemple, si vous souhaitez apprendre à cuisiner des plats traditionnels de famille, Gemini 3 peut interpréter et traduire des recettes manuscrites dans différentes langues, générant ainsi des recettes à partager avec votre famille.

Ou, si vous souhaitez apprendre un nouveau sujet, vous pouvez fournir des articles académiques, des vidéos longues ou des tutoriels, et il peut générer des cartes mémoire interactives, des visualisations ou d'autres formats de code pour vous aider à maîtriser les connaissances associées.

Il peut même analyser vos vidéos de matchs de pickleball, identifier les domaines à améliorer et élaborer un plan d'entraînement pour vous aider à améliorer vos compétences.

Pour vous aider à mieux comprendre les informations en ligne, le mode IA dans la recherche utilise maintenant Gemini 3 pour offrir une nouvelle expérience UI générative, avec par exemple des mises en page visuelles immersives, des outils interactifs et des simulations, le tout généré instantanément en fonction de vos requêtes.

Développer n'importe quoi

Sur la base du succès de 2.5 Pro, Gemini 3 a tenu sa promesse de transformer n'importe quelle idée des développeurs en réalité. Il excelle dans la génération sans échantillon, capable de traiter des invites et des instructions complexes, rendant ainsi des interfaces utilisateur Web plus riches et plus interactives.

Gemini 3 est le meilleur modèle de codage Vibe et de codage Agent construit par Google à ce jour, rendant les produits Google plus autonomes et améliorant considérablement l'efficacité des développeurs. Il occupe la première place du classement WebDev Arena avec un score Elo impressionnant de 1487. De plus, il a obtenu un score de 54,2 % dans le test Terminal-Bench 2.0, qui vise à évaluer la capacité du modèle à utiliser des outils pour opérer un ordinateur via le terminal. En même temps, il a également largement surpassé la version 2.5 Pro dans le test SWE-bench Verified (score de 76,2 %), qui évalue la performance des agents de codage.

Maintenant, les utilisateurs peuvent construire avec Google AI Studio, Vertex AI, Gemini CLI et la toute nouvelle plateforme de développement d'agents intelligents de Google, Google Antigravity, avec Gemini 3. Il est également compatible avec des plateformes tierces telles que Cursor, GitHub, JetBrains, Manus, Replit.

Par exemple, créer un jeu de vaisseau spatial rétro en 3D avec des effets visuels plus riches et une interactivité plus forte.

Par exemple, créer des interfaces utilisateur Web et des applications plus riches et plus interactives :

Planifier quoi que ce soit

Depuis le Gemini 2, Gemini a considérablement amélioré sa capacité de planification dans les tâches à long terme.

La capacité de planification de Gemini 3 a été confirmée lors du test Vending-Bench 2 : Gemini 3 a atteint le sommet de ce classement lors du test de simulation de gestion de distributeurs automatiques, en gérant l'exploitation commerciale virtuelle grâce à une planification à long terme.

Au cours d'une simulation complète d'une année d'opérations, Gemini 3 Pro a toujours maintenu une stabilité des appels d'outils et une cohérence dans les décisions, réalisant un retour sur investissement plus élevé tout en restant concentré sur les objectifs de la mission.

Le Gemini 3 Pro démontre une capacité de planification à long terme supérieure, capable de générer des rendements plus élevés par rapport à d'autres modèles de pointe.

Gemini Agent peut également aider à organiser la boîte de réception Gmail.

Gemini 3 est désormais entièrement ouvert. À partir d'aujourd'hui, les utilisateurs ordinaires et les utilisateurs abonnés peuvent utiliser le nouveau modèle via l'application Gemini et le mode AI de recherche ; les développeurs et les clients entreprises peuvent également se connecter via AI Studio, Vertex AI et d'autres canaux. Quant au très attendu “mode de réflexion approfondie”, il devrait être lancé exclusivement pour les abonnés Google AI Ultra dans les prochaines semaines.

De plus, selon les cartes de modèle précédemment divulguées, il y a beaucoup d'informations clés à prendre en compte : Google utilise TPU pour entraîner ce modèle depuis le début, en tant que MoE, avec 1M d'entrées et 64k de sorties de tokens, MoE signifie qu'ils peuvent se permettre de le rendre bon marché.

En ce qui concerne la tarification, Gemini 3.0 Pro introduit un mécanisme de tarification par niveaux basé sur la longueur du contexte : pour les tâches de moins de 200k tokens, le prix d'entrée/sortie est de 2,00 $/12,00 $ (par million de tokens) ; au-delà de 200k tokens, les prix sont respectivement de 4,00 $ et 18,00 $.

Une toute nouvelle expérience de développement « priorité aux intelligences »

Google Antigravity est la toute nouvelle plateforme de développement d'agents intelligents de Google, permettant aux développeurs d'opérer à un niveau plus élevé et axé sur les tâches. Grâce aux capacités avancées de raisonnement, d'utilisation d'outils et de programmation d'agents de Gemini 3, Google Antigravity transforme l'IA assistée d'un simple outil dans la boîte à outils des développeurs en un partenaire actif.

Bien que le cœur de Google Antigravity soit une expérience d'IDE (environnement de développement intégré) familière, ses agents ont été élevés à une interface dédiée et ont reçu l'autorisation d'accéder directement à l'éditeur, au terminal et au navigateur. Maintenant, les agents peuvent planifier de manière autonome et exécuter simultanément des tâches logicielles complexes de bout en bout, tout en vérifiant leur propre code.

En plus de Gemini 3 Pro, Google Antigravity a également étroitement intégré le modèle Gemini 2.5 Computer Use de Google, qui est le dernier modèle de contrôle de navigateur, ainsi que son modèle d'édition d'images haut de gamme Nano Banana (Gemini 2.5 Image).

expérience de première main

Puisque la version préliminaire de Gemini 3 Pro a été lancée sur la plateforme AI Studio, nous avons également eu l'occasion de l'essayer.

Invite : SVG de la SILHOUETTE DE NEW YORK Utilisez toutes les bibliothèques nécessaires pour réaliser cela, mais assurez-vous que je peux tout coller dans un seul fichier HTML et l'ouvrir dans Chrome. Rendez-le intéressant et très détaillé, montrez des détails que personne n'attendait, soyez entièrement créatif et magnifique dans un seul bloc de code.

Invite : Créez un jeu Space Invaders visuellement époustouflant.

Un SVG animé d'un pélican faisant du vélo.

Comparé à la version précédente, Gemini 3 a fait de grands progrès, mais il y a encore des bugs, comme les pédales de vélo qui tournent dans le vide.

Nous avons encore changé pour un mot d'indication plus clair : Créez un code SVG animé unique, complet et autonome (sans fichiers ou images externes) d'un mignon pélican faisant du vélo vu de profil. Cette fois, le vélo généré par Gemini 3 semble ne pas avoir de pédales.

Écrit à la fin

Dans le vote « Quelle entreprise aura le meilleur LLM d'ici la fin 2026 ? » lancé par le blogueur X Chubby, Google Gemini est largement en tête.

Cette reprise de la confiance sur le marché se reflète également dans les données, le PDG d'Alphabet Sundar Pichai a passé en revue les progrès de Gemini au cours des deux dernières années dans un blog officiel : les utilisateurs actifs mensuels d'AI Overviews ont atteint 2 milliards, l'application Gemini a dépassé les 650 millions d'utilisateurs actifs mensuels, de plus, plus de 70 % des clients cloud et 13 millions de développeurs utilisent son modèle génératif.

En regardant les deux dernières années, depuis la réponse précipitée lors du lancement de Bard (l'ancêtre de Gemini) et la chute des actions, jusqu'à la fusion douloureuse avec Google DeepMind, le rappel des fondateurs et l'obtention d'un prix Nobel, Google a réalisé un “virage d'éléphant” digne d'un manuel.

Ce géant qui a autrefois défini le Transformer et qui est désormais « All in Gemini » est prêt à lancer une contre-attaque complète.

Quant à savoir s'il peut réellement mettre fin à la bataille des « meilleurs LLM », ne vous inquiétez pas, laissez les balles (et les serveurs) voler un peu plus longtemps.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.