Google'ın rövanşı acı oldu

Hani şu hepimizin bir tane "görgüsüz zengin" akrabası vardır ya... Köyün en havalı arabasını alır, gelir düğün dernekte anahtarlığını sallaya sallaya gezer. Herkesin gözü ondadır.

Üç yıl önce yapay zekâ mahallesinin 'zengin akrabası' da ChatGPT idi. Kapıya yeni model arabasıyla GPT-5.1 dayandı. Herkesin işini elinden alacak diye kıyamet koptu.

Google ise mahallenin o eski, güvenilir ama kimsenin dönüp bakmadığı "Reno 12" gibiydi. Yatırımcılar fısıldıyordu; "Bunlar bu yarışın 'AI roadkill'i (yapay zekâ yol kurbanı) olacaklar..."

Hatta Wall Street, Google'ın hisseleri 'cansız kalırken' bu devin artık bittiğini konuşuyordu. İşte o anlarda Google, sessiz sedasız o emektar arabasına bir roket motoru takıyormuş meğer.

★★★

Ve şimdi, hikâye değişti. Söz konusu roketin adı... Gemini 3.

Google'ın son yapay zekâ modeli Gemini 3'ün yayınlanmasıyla, Silikon Vadisi'nin o görgüsüz akrabası bir anda şaşkına döndü. ünkü sadece laf değil, elimizde artık rakamlar ve bilimsel testler var.

The Wall Steet Journal'de çıkan makalenin altını çizdiği gibi, sektörün kabul ettiği karşılaştırma (benchmark) testlerinde, Gemini 3 rakiplerini geride bırakarak zirveye oturdu.

Bunu bir "Google reklamı" olarak görmeyin. Bu, bir teknoloji devi için yıllardır aranan, kaçırılan zorlu galibiyet idi.

Bulut içerik yönetim şirketi Box'ın CEO'su bile şaşkına döndü. İlk testlerinde "Değerlendirmemizde bir hata mı yaptık" diye düşündüler. ünkü aradaki sıçrama o kadar büyüktü ki, her seferinde Gemini 3, çift haneli puan farkıyla öne çıktı.

Anladığım kadarıyla bu fark artık "Biraz iyi olmuş" denilecek türden değil, ezber bozan cinsten...

★★★

Peki fark nerede oluştu

Gemini 3, sadece metin yazmakla kalmıyor. Aynı zamanda görme, analiz etme ve akıl yürütme becerilerinde de rakiplerine fark attı.

Rakiplerini bir düzineyi aşkın testte geride bıraktığı konular, biz kullanıcılar için önemli... Uzman seviyesinde bilgi, mantık bulmacaları, karmaşık matematik problemleri ve görsel tanıma...

Hatta Google mühendisleri, modelin "düşünme" yeteneğini test etmek için Vending Bench adında eğlenceli ama bilimsel bir test bile geliştirdi.

Bu testte model, bir otomat makinesini işletmek, envanteri takip etmek, sipariş vermek ve para kazanmak için fiyatları belirlemek zorundaydı. Yani klasik "yazı yazma" becerisinin ötesinde, planlama ve problem çözme yeteneği test ediliyordu. Ve Gemini 3 beklentilerin çok üzerinde bir performans sergileyerek, yapay zekada mantıksal düşüncenin sınırlarını zorladı.

★★★

"Ya kullanım" diyenleriniz olacaktır.

Elbette pazarın "görgüsüz zengini" ChatGPT, haftalık 800 milyon kullanıcısıyla hâlâ zirvede... Ama Gemini'nin kullanıcı kitlesi, geçen temmuzdaki aylık 450 milyon kullanıcıdan, bir ay sonra ağustosta 650 milyona