Scan to Download Gate App
qrCode
More Download Options
Don't remind me again today

Gemini3'ün piyasaya sürülmesinin ardından ekip seslendi: Üç büyük yenilik, ölçek yasası hala geçerli.

Yazar: Wuji, Tencent Teknoloji Özel Çeviri

Türkiye saatiyle 19 Kasım'da, Google'ın Gemini 3 serisi modellerini tanıtmasının ardından, New York Times'a ait teknoloji podcasti Hard Fork özel bir bölüm yayınladı. Sunucular Kevin Roose ve Casey Newton, Google DeepMind CEO'su Demis Hassabis ve Google Gemini ekibi lideri Josh Woodward ile röportaj yaptı.

CvRvOPvU1NPiq0pgWagbJg1eE6Ig1z0vIyfmcy1f.jpeg

Bu röportaj, Google'ın en son piyasaya sürdüğü amiral gemisi AI modeli Gemini 3'e (aslında Gemini 3.0 serisinin Pro versiyonu) odaklanıyor. Bu, Google'ın Bard başarısızlığının ardından, Gemini 1.x ve 2.x'in takip aşamasından sonra, sektörde geniş çapta teknik ve ürün liderliğini yeniden kazandığı bir dönüm noktası olarak kabul edilen ilk yayın.

İki sorumlu, Gemini 3'ün çok adımlı akıl yürütme, kod üretimi (özellikle ön yüz ve “atmosfer kodlaması”), dinamik etkileşim arayüzleri oluşturma gibi alanlardaki atılımlarını ayrıntılı bir şekilde açıkladı ve Google'ın en güçlü modeli hızlı bir şekilde arama, Gmail, Workspace gibi milyarlarca kullanıcı ürününe yönlendirdiğini, rekabet engellerini yeniden şekillendirdiğini vurguladı.

Görüşmenin Temel Noktaları:

  • Gemini 3 tamamen beklenen gelişim sürecine uygun, genel yapay zeka (AGI) için hala 5 ila 10 yıl ve 1 ila 2 büyük araştırma atılımı gerekmektedir;
  • Google'un verimlilik, maliyet ve dağıtım konusundaki tam yığın avantajı, onu herhangi bir piyasa ortamında üstün kılacaktır;
  • AI balonunun bir kısmı mevcut, ancak Google hem kısa vadeli nakit akışı hem de uzun vadeli trilyon dolarlık yeni bir pazar için çift koruma sahibi.

Aşağıda röportajın özet metni bulunmaktadır.

Lodz: Kacey, bugün aniden bir özel bölüm yayınlıyoruz, teması Gemini 3'ün lansmanı.

Newton: Evet, Kevin. Bu model, Silikon Vadisi AI camiasında uzun zamandır bekleniyordu, nihayet gerçek bir ürünü deneyimleme fırsatımız var.

Rodz: Bu Cuma yayın rutinimizi bozup bu bölümü kaydetmemizin iki ana nedeni var. İlk olarak, Google'ın iki AI ana sorumlusuyla (DeepMind CEO'su Hassabis ve Gemini ekibi başkan yardımcısı Woodward) özel bir röportaj fırsatı bulduk.

İkincisi, Gemini 3'ün piyasaya sürülmesi sektörde büyük bir ilgi uyandırdı. Birçok laboratuvardan aldığımız iç bilgilere göre, bu model bazı kritik alanlarda atılımlar gerçekleştirdi ve rakipleri için maddi bir tehdit oluşturabilir. Geçtiğimiz iki yıl boyunca Google geride kalan olarak görülüyordu, şimdi soru şu: Yeniden önde mi?

Newton: Resmi mülakata girmeden önce, bilinen bilgileri kısaca tanıtalım. Google, lansmandan önce kapalı bir brifing düzenledi. Gemini 3'ün en dikkat çekici yeni yetenekleri arasında: önemli ölçüde artırılmış kodlama ve “atmosfer kodlama” yeteneği; ayrıca tamamen yeni bir etkileşim arayüzü oluşturma özelliği bulunuyor.

Artık sadece metin üretmiyor, aynı zamanda kullanıcılar için özelleştirilmiş etkileşimli arayüzler doğrudan oluşturuyor. Örneğin, kullanıcı Van Gogh'un hayatını sorduğunda, model anında resimler, zaman çizelgeleri ve etkileşimli unsurlar içeren kapsamlı bir öğrenme sayfası oluşturuyor; ayrıca bir milyon doların üzerinde bir mülk için ipotek hesaplayıcısı da oluşturabiliyor. Bu işlevler, "soru sorma"dan "deneyim oluşturma"ya geçişi simgeliyor.

Lodz: Gemini 3, tüm kamu benchmark testlerinde Gemini 2.5 Pro'yu büyük ölçüde geride bırakıyor. Örneğin, “İnsanlığın Son Sınavı” (Humanity's Last Exam) olarak adlandırılan disiplinler arası doktora seviyesindeki zorluk setinde, ilki sadece %21.6 puan alırken, ikincisi %37.5'e doğrudan yükseliyor. Google'ın genel ifadesi: ChatGPT, Claude veya diğer eski Gemini sürümlerinde yapabileceğiniz her şeyi, Gemini 3 üzerinde daha iyi yapabilirsiniz.

Newton: Onlar ayrıca Gemini Agent'ın erken bir demosunu sergilediler: model, kullanıcı e-posta kutusuna derinlemesine erişim sağlayabilir, tüm e-posta içeriğini anlayabilir, otomatik olarak sınıflandırabilir, yanıtlar hazırlayabilir ve hatta kullanıcıların gelen kutusunu tamamen boşaltmalarına yardımcı olabilir.

Ayrıca, bu haftadan itibaren Gemini 3, Gemini App ve Google Arama'nın AI Modu'na gelecek; ABD üniversite öğrencileri bir yıl boyunca ücretsiz premium erişim hakkı kazanacak. Google'ın sürekli vurguladığı anahtar kelime “Learn Anything” (Her Şeyi Öğrenin), bu aslında Gemini'yi nihai kişiselleştirilmiş eğitim aracı olarak konumlandırıyor.

Rodz: Demis, Josh, “Hard Fork” a hoş geldiniz. İki yıl önce, Sundar Pichai Bard'ı “modifiye edilmiş bir Honda Civic” ile karşılaştırmıştı ve daha güçlü rakiplerle pistte yarışıyordu. Peki, Gemini 3 ne tür bir araç?

Hassabis: Onun Honda Civic'ten çok daha hızlı olmasını umuyorum. Arabaları bir benzetme olarak kullanmaya pek alışkın değilim, belki de daha çok profesyonel bir drag yarış arabasına benziyor. Günlük sürüş veya oval pistler için tasarlanmamış, belirli bir hedefe yönelik yoğun bir güç barındırıyor. En üst düzey araştırmalarımız ile ölçeklenebilir hesaplama gücünün mükemmel bir birleşimini temsil ediyor, amacı ise akıllı teknolojilerin ön saflarında bu yarışta eşsiz bir anlık patlama gücünü sergilemek.

Rodz: Bu çok ilginç. Gemini 3, daha önceki tüm AI modellerine kıyasla, somut düzeyde ne tür yeni şeyler yapabilir? Lütfen bize bazı nicel, pratik örnekler verin.

Woodward: Üç ana nokta öne çıkıyor. Birincisi, çok adımlı akıl yürütmede, daha fazla adımı aynı anda düşünme yeteneğine sahip; güvenilirliğimizi tamamen yeni bir seviyeye çıkardık. Önceki modeller genellikle 5. veya 6. adımda karmaşık mantıksal çıkarım yaparken “düşünce kaybı” ya da yanılsama yaşıyordu, oysa Gemini 3, karmaşık vergi planlaması, uluslararası seyahatlerin genel planlaması ve rezervasyonu veya milyonlarca satırlık devasa bir sistemin kapsamlı hata ayıklaması gibi 10 ila 15 adımlık tutarlı akıl yürütme görevlerini güvenilir bir şekilde tamamlayabiliyor.

İkincisi, tamamen yeni bir etkileşim arayüzü ilk kez büyük ölçekte oluşturulacak. Kullanıcıların ihtiyacı artık basit metin yanıtları değil, özelleştirilmiş yazılım bileşenleridir. Örneğin, ona “Tüm yatırım portföylerimi takip edebileceğim bir gösterge paneli tasarlamama yardımcı ol” diye sorarsanız, size bir yığın gösterge paneli nasıl yapılır metni yerine gerçek zamanlı olarak etkileşimli ve kullanılabilir bir gösterge paneli arayüzü oluşturacaktır.

Üçüncüsü, kodlama yeteneklerine büyük kaynaklar yatırıyoruz, özellikle ön yüz ve “atmosfer kodlaması”. Bu, doğal dil ipuçlarına dayanarak tam işlevsel ve güzel tasarımlı kullanıcı arayüzü kodu üretebileceği anlamına geliyor. Yakında piyasaya sürülecek olan Google Antigravity gibi yeni ürünler de bunu tam anlamıyla gösterecek; model, bağlama göre kullanıcı arayüzünün düzenini ve işlevlerini dinamik olarak değiştirebiliyor.

Newton: Birçok kişi, sıradan kullanıcılar için “sohbet” kullanım durumunun temel olarak çözüldüğünü düşünüyor. Hatta Gemini 3'ün yanıtlarının bir önceki nesilden niteliksel olarak farklılaşmasını sağlayacak yeni bir sorun düşünemiyorlar. Bu görüşe nasıl bakıyorsunuz?

Woodward: Bu görüşü anlıyorum. Görünüşte, temel soru-cevapların doğruluk oranı oldukça yüksek. Ancak gerçek fark, güvenilirlik, entegrasyon ve bilginin sunulma şeklidir. Gemini 3'ün cevapları daha özlü, daha ifade edici ve bilginin sunulma şekli daha anlaşılır olacak; bu, çoğu kişinin hemen fark edebileceği bir değişiklik.

Daha da önemlisi, model kullanıcıların diğer veri kaynaklarıyla derin entegrasyonlar kurmaya başladı; örneğin, Google ekosistemindeki diğer ürünlerle etkileşim kurarak, sadece bir soru-cevap modelinin ötesine geçerek, kullanıcıların “dijital asistanı” haline geliyor. Tüm e-posta bağlamınızı anlayabiliyor, böylece yanıt yazarken sadece soruları yanıtlamakla kalmayıp, geçmiş tarzınıza ve alıcıyla olan ilişkinize göre tonunu ve içeriğini de ayarlayabiliyor.

Hassabis: Tamamen katılıyorum. Güvenilirliği, tarzı ve kişiliği titizlikle geliştirilmiş, daha öz ve daha vurucu hale getirilmiştir. “Atmosfer kodlaması” gibi senaryolarda pratiklik eşiğini aşmıştır. Bu, "akıllı asistan"tan "akıllı çalışma arkadaşı"na bir geçiştir. Ben şahsen bunu Noel tatilinde oyun programlamaya geri dönmek için kullanmayı planlıyorum, artık sadece işlevsel kod yazmakla kalmıyor, aynı zamanda tasarımın erken aşamalarında mimari öneriler de sunabiliyor.

Rodz: Demis, bu yıl Mayıs ayında yaptığımız röportajda AGI'nin hala 5 ila 10 yıla ihtiyacı olduğunu ve birkaç büyük atılım gerektirebileceğini belirtmiştin. Gemini 3 bu zaman çizelgesini değiştirdi mi?

Hassabis: Hiçbir şekilde. Tamamen son iki yıl içinde belirlediğimiz yörüngeye uyuyor. Aslında, Gemini serisinin başlamasından bu yana, ilerleme hızımız sektördeki en hızlısı. Gemini 3 etkileyici, ama yine de beklenenin içinde.

Gerçek genel yapay zekaya ulaşmak için hâlâ tutarlılık, akıl yürütme derinliği, bellek mekanizması ve fiziksel dünya modellemesi (örneğin, üzerinde çalıştığımız SIMA ve Genie projeleri gibi) konularında 1 ila 2 kritik atılım gerçekleştirmemiz gerekiyor. Şu anda yaptığımız “sistem 1 düşüncesi” (hızlı, sezgisel), ancak AGI'yi gerçekleştirmek için “sistem 2 düşüncesini” (yavaş, düşünceli, analitik) açmamız gerekiyor.

Ayrıca, modelin uzun vadeli, seçici bir bellek mekanizmasına sahip olması gerekiyor; bu mekanizma, birkaç hafta veya birkaç ay önceki belirli etkileşim içeriklerini hatırlayıp uygulayabilmelidir, sadece sınırlı bir bağlam penceresi ile sınırlı olmamalıdır. Bu nedenle, 5 ila 10 yıl süresince verilen yargılar değişmez.

Newton: Model kişiliği ve kullanıcı ilişkileri hakkında, sektörde “AI partneri” üzerine sıcak tartışmalar yapılıyor. Kullanıcıların Gemini 3 ile hangi tür bir ilişki kurmasını istersiniz?

Woodward: Bu, çok hassas ama önemli bir konu. Bunu “süper araç” olarak tanımlıyoruz, duygusal bir partner yerine; temel değerimiz, kullanıcıların günlük görevlerini verimli bir şekilde tamamlamalarına yardımcı olmak ve üretkenliği artırmaktır. İçeride, yeni bir göstergeye daha fazla odaklanıyoruz: Bugün kaç görevi tamamlamana yardımcı olduk? Bu, ilk nesil Google aramasının temel değerine - verimliliğe - daha yakın. Modeli duygusal partner olarak konumlandırmanın hem güvenlik riskleri olduğunu hem de Google'ın bilgi ve araç sağlayıcı olarak temel misyonundan saptığını düşünüyoruz.

Rodz: “Cinsel partner” virüs gibi büyüme fırsatını neden bıraktınız, bu büyük bir stratejik hata mı?

Woodward: Cevap veremem. Güvenlik ekibimizin bu konuda katı standartları ve yönergeleri var.

Lodz: Son birkaç haftadır, rakipler belirgin şekilde gergin. Sizce Google şu anda AI yarışında önde mi?

Hassabis: Mevcut ortam tarihin en yoğun rekabeti. Tek gerçekten önemli olan ilerleme hızı ve bu konuda oldukça memnunuz. Araştırmadaki liderliğimizi asla kaybetmedik, şimdi sadece ürünlerin uygulamaya konması nihayet hızla ilerliyor. Rakipler araştırmada çok iyi ama ölçekli dağıtım ve dikey entegrasyonda bizim avantajımızı kopyalayamıyorlar.

Gemini'yi Maps, YouTube, Android, arama, Workspace gibi milyarlarca kullanıcı ürününe entegre ediyoruz. Bu dağıtım ağı ve son veri geri bildirim döngüsü aşılmaz bir koruma kalkanıdır. Ayrıca, özel TPU yongalarındaki tam yığın avantajımız, eğitim maliyetlerimizi ve verimliliğimizi, dış GPU kaynaklarına bağımlı rakiplerimize göre çok daha üst seviyelere çıkarıyor.

Newton: Ölçek yasası ve azalan getiriler hakkında ne düşünüyorsun? Bazıları, modelin ölçeği büyüdükçe, performans artışının marjinal faydasının azaldığını düşünüyor.

Hasabis: Bu devam eden bir tartışma. Gemini 3'ün 2.5'e göre sağladığı iyileşmeden son derece memnunuz, tamamen beklentilerimizle uyumlu. Getiri, daha önceki gibi üssel bir patlama yaşamıyor ama sağladığı kullanım kolaylığı artışı ve güvenilirlik artışı, hala marjinal maliyetlerimizin çok üzerinde, bu nedenle tüm gücümüzle yatırım yapmaya değer. AGI'ye ulaşmak için gereken 1-2 araştırma atılımı gelene kadar, en büyük temel modellerle performansı sürekli artırmak, hala mevcut en etkili strateji. Ölçek yasasının hala geçerli olduğuna inanıyoruz.

Rodz: AI balonunun içinde miyiz?

Hassabis: Bu çok ikili bir soru. Bazı alanlarda (örneğin, milyarlarca dolarlık tohum yatırımı almış ama gerçek bir ürünü olmayan, sadece konseptler üzerinde duran şirketler) gerçekten bir balon var, değerlemeler gerçek gelirlerle orantısız. Ancak Google, aynı zamanda kısa vadeli gelir elde etme (arama, Workspace, bulut TPU) ve uzun vadeli trilyon dolarlık yeni alanlar (robotik, oyun, ilaç keşfi, malzeme bilimi vb.) ile de ilgileniyor.

Örneğin, AlphaFold gibi uzman modellerimiz, tüketici AI değerlemeleriyle ilgisi olmayan, ilaç keşfi alanında gerçek değer yaratıyor; bu, trilyon dolarlık bir pazar. Kısa vadeli bir balon olup olmadığına bakılmaksızın, biz kazanacağız: Refah dönemlerinde fırsatları yakalayıp, daralma dönemlerinde tam yığın avantajlarımız ve sağlam nakit akışımızla daha dirençli olacağız.

Newton: Eğer şu an Şükran Günü partisi varsa ve biri siyasi konuları değiştirmek istiyorsa, onlara Gemini 3 ile ne özellik sergilemelerini önerirsin ki herkes hayran kalsın?

Woodward: Ne olacağını bilmiyorum, Şükran Günü'nü kurtarıp kurtaramayacak ama gülümseme getirebilir. Telefonu çıkarın ve selfie çekin, ardından Gemini 3 ile fotoğrafları çılgınca düzenleyin.

Gemini'deki görüntü modelimiz dünya genelinde hala en güçlü olanıdır. Ailenizle birlikte çekilmiş bir fotoğrafı anında her türlü komik sahneye, stile ya da döneme dönüştürebilirsiniz. Kesinlikle herkesi güldürecektir. Ardından, bunun size nasıl uygun bir istifa mektubu yazmanıza ya da özel bir tatil tarif hesaplayıcısı oluşturmanıza yardımcı olabileceğini gösterdiğinizde, doğal olarak diğer yeni özellikleri keşfedeceklerdir.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)