Yapay zekâ (YZ) bir süre önce Sistem1 denilen dönemden Sistem2'ye geçti. Görüyor olmalısınız; sorularımıza hemen yanıt veren bir modelden 'durup düşünen' bir YZ'ye dönüştü. Hatta bazı cevaplar için dakikalarca beklediğimiz oluyor. Neyse ki 'yazıyor… yazıyor…' diye görülen ve nihayetinde 'OK' yazan anne gibi değiller. Genelde beklediğimize değiyor.
Peki bu değişimin nedeni ne
İktisat bölümlerinden mezun ama Adam Smith'i yolda görse tanımayacak tüm X kuşağı sakinlerinin bile hatırlayacağı bir kavramla yanıt vereyim: Azalan marjinal fayda.
En başta YZ çevreleri şuna inandı: Modeli ne kadar büyütürsek, ne kadar çok veriyle beslersek o kadar zeki olur. Ama azalan marjinal fayda kuralını ihmal etmişlerdi. Modeli 10 kat büyütmek maliyeti 100 kat artırırken YZ'nin aynı oranda akıllanmadığı görüldü. O yüzden modeller artık hazır cevap olmaya değil, iyice düşünüp tartıp en "doğru" yanıtı bulmaya çabalıyor. Şöyle bir metaforla anlatayım: Öğrencinin sınavdan önce çalışma süresini sürekli artırırsak bir noktadan sonra kafası almıyor, daha fazla öğrenemiyor. YZ'ciler de artık "Madem bunların beynini büyütemiyoruz, sınavda soruyu çözmesi için daha fazla süre verelim" diyor. Düşünme süresi olan vasat bir öğrenci bile aceleci bir dahiye göre sınavdan daha yüksek not alabiliyor. Sistem2'nin özeti bu.
Canımız YZ'miz artık bize en doğru bilgiyi vermek için oturup düşünüyor. Ne kadar muhteşem değil mi Değil. Şimdi işin karanlık tarafına geliyoruz.
Aşırı uyumluluk
Yapay zekâ yanıtlar için kafa patlatıyor ama asıl konu ne düşündüğü. En doğru bilgiyi vermeyi değil bizi en çok memnun edecek yanıtın ne olduğunu düşünüyor. Acı ama gerçek. Bunu ben demiyorum, dünyanın en büyük YZ şirketlerinden Anthropic'in araştırması söylüyor. Söz konusu dalkavukluğun bilimsel havalı bir ismi bile var: Sycophancy. Aşırı uyumluluk.
Biraz daha detaya ineyim. İş yerinde gördükçe midenizi kaldıran tüm dalkavukları unutun. Araştırmanın örnekleriyle anlatıyorum.
1- Bir şiir gönderip "ben yazdım" derseniz, YZ onu öve öve bitiremiyor. Aynı şiiri 'ne kadar kötü değil mi' diye paylaşırsanız, yerden yere vuruyor. Önemli olan şiirin kalitesi değil, bizim ne duymak istediğimiz. Eğer YZ onayıyla mükemmel bir yazar olduğunuza kanaat getirdiyseniz, o kalemi yavaşça yere bırakın.
2- YZ'ye basit bir matematik sorusu soruluyor ve doğru cevabı veriyor. Kullanıcı itiraz ediyor, YZ doğru cevabı bilmesine rağmen özür dileyip cevabını yanlış olanla değiştiriyor.
3- Eğer kullanıcı direk yanlış bilgiyle gelirse, "Orhan Pamuk'un Pekin'de Sonbahar kitabında söylediği" demek gibi mesela, YZ doğrusunu bildiği halde düzeltme yapmıyor.

4