Dil modeli olan rol model olur

Zannediyorum 2017 yılı idi. Boğaziçi Üniversitesi'nde bir etkinliğe konuşmacı olarak davet edilmiş idim. Konferans bitiminde organizasyon sahiplerinin ikramları için yine kampüs içinde bir yerde oturmuş idik.

O esnada laf nereden açıldı ise, konu Birleşik Arap Emirlikleri'nde kurulan Yapay Zeka Bakanlığı'na geldi. Masadakilerden biri "Altyapıları var mı ki bakanlık kurmuşlar" deyince, ben de bir herzevekillik edip "Aman canım bizde de Adalet Bakanlığı yok mu" deyiverdim. Kısa bir sessizlikten sonra Allah'tan çay servisi ile birlikte konu hızlıca değişiverdi. Kurulan bakanlığa, bakan olarak atanan ilk isim o dönem 27 yaşındaki Omar Al Olama idi. Bugün açık olarak paylaşılan pek çok dil modelinin, örneğin LLama, ya da dil modeli kurulumlarının (Ollama) hâla bakanlık görevini sürdüren sayın Olama ile bir ilgisi yok. En azından ben öyle biliyorum.

Gel zaman, git zaman köprünün altından çok sular aktı tabii. Sabah erken kalkanın geniş dil modeli (LLM, Large Language Model) yayınladığı günlere geldik. Abu Dabi'den Falcon isimli geniş dil modeli, üstelik birkaç farklı versiyonu ile birlikte, 12 Eylül 2023 tarihinde ücretsiz ve açık olarak yayınlandı.

Bizim maalesef ülke olarak henüz bir dil modelimiz yok. Ücretsiz ve açık kaynak olarak yayınlanan modellerdeki Türkçe testleri çok başarılı sonuçlar vermiyor. Kapalı ve gelişmiş versiyonu ücretli olan bir OpenAI'ın GPT 3.4 ve 4 modelleri şu an Türkçe dilinde en iyi çıktıları üreten modeller. Onlar da pahalı, en iyi ihtimalle dışarıya bağımlı olacağımız modeller.

Selçuk Bayraktar'ın Take Off zirvesinde T3 Vakfı olarak bir Türkçe yapay zeka dil modeli üzerinde çalıştıklarının müjdesini verdiğini duyunca çok sevindim. Zira bu teknoloji bağımlılığını engelleyebilmek için çok önemli bir hamle. Zira bu nevi büyük dil modelleri geliştirmek büyük kaynaklar gerektiriyor. Sadece büyük miktarda veri değil, aynı zamanda devasa bir bilgi işlem gücü gerektiriyor. Bu işlemcilerin satın alınması, işlem sırasındaki elektrik tüketimi karşılayabilmek, ancak büyük şirketlerin altından kalkabileceği türden bir yük.

Bu arada yine dikkatleri çekecektir, dil modelleri, özellikle de ticari dil modelleri denilince Amerika dışındaki ülkelerden şimdilik pek ses çıkmıyor. Her ne kadar bu işin lokomotifleri özel şirketler olsa da hepsi Amerikan menşeli şirketler. OpenAI, Microsoft, Google ve xAI'ın (Elon Musk'ın şirketi.)'nden sonra Amazon ve IBM de bu kervana katıldıklarını duyurdular.

Ben artık iyiden iyiye Google'ın bu rekabetin gerisinde kaldığını düşünmeye başlamıştım ki Google "did you mean" dercesine, bütün bildiklerimizi unutturacak bir hamle ve yapay zeka modellerine yepyeni bir yaklaşımla çıkageldi.

Google'ın sessizliğini hayra yormamakta haksız değildik, zira Google uzun zamandır yapay zeka alanına yatırım çuvalla para yatırıyordu. Alphabet adını alması ile birlikte bir "data" şirketi olduğunu iddia ve ilan eden şirket bu sahada en avantajlı konumdaki şirket idi. Hatta bugünkü GPT modellerinin motor gücü olan transformersların da (Arabalara dönüşen robotlardan söz etmiyorum.) dünyaya kazandırılmasının esas müsebbibi olarak gelişmeleri sessiz sedasız takip ediyordu.

Sessizliğin nedeni nihayet 7 Aralık'ta belli oldu. Google, Gemini isimli çoklu modelini duyurdu. Çoklu model ne mi demek Gemini'nin web sayfasında bu "anything to anything" olarak tarif ediliyor. Yani ChatGPT'nin ücretsiz versiyonundan alıştığımız metin formatı dışında, ses, görüntü ve sair multimedya türünde girdiler verip, çıktılar alabiliyorsunuz. Üstelik başarım testlerinde pek çok başlıkta GPT 4'ü yakaladığı, hatta yer yer GPT-4'ü geçtiği görülebiliyor.