Yeni AI Modeli: OpenAI’yi Zorlayan ve Yalnızca 50 Dolara Eğitilen Devrim! Yapay zeka dünyasında çığır açan bir gelişme yaşandı! OpenAI’nin güçlü modelleri kadar etkili olan yeni bir AI modeli, yalnızca 50 dolar gibi düşük bir bütçeyle eğitildi. Bu inanılmaz başarı, yapay zeka teknolojisinin nasıl daha erişilebilir ve yenilikçi hale geldiğini gözler önüne seriyor. Daha az kaynakla daha fazlasını başarmak mümkün mü? İşte bu yeni modelin hikayesi!
Yapay zeka dil modellerinin artık birer araç olmaya başladığı açıkça görülüyor. DeepSeek gibi açık kaynak projelerin hızla yükselmesi; bu tür modellerin milyarlarca dolarlık girişim sermayesi olmadan da oluşturulabileceğini gösteriyor. Yine bu fikri destekleyen yeni bir model olan S1, Stanford ve Washington Üniversitesi’nden araştırmacılar tarafından yalnızca 50 dolardan az bir bulut işlem kredisiyle eğitildi.
S1, OpenAI’nin o1 modeliyle doğrudan rekabet eden bir model. “Akıl yürütme” modeli olarak tanımlanan bu model, sorulara yanıt üretirken işini kontrol edebilmek için ilişkili sorular üzerinden “düşünerek” hareket ediyor. Örneğin, bir modelden yolda bulunan tüm Uber araçlarını Waymo araçlarıyla değiştirmenin maliyetini hesaplaması istenirse, işini birçok adıma bölecektir — bugün yolda kaç tane Uber aracı olduğunu ve bir Waymo aracının üretim maliyetini kontrol etmek gibi.
TechCrunch’a göre, S1, Google’ın Gemini 2.0 Flashing Thinking Experimental (evet, bu isimler korkunç) modeli üzerinden akıl yürütme yetenekleri geliştirilmiş, rafine bir dil modeli. Google’ın modeli, her yanıtın arkasındaki düşünce sürecini göstererek, S1’in geliştiricilerinin modele nispeten az bir eğitim verisi—1.000 özenle seçilmiş soru ve cevap—verip Gemini’nin düşünce sürecini taklit etmeyi öğretmelerine olanak tanıyor.
Araştırmacıların S1’in akıl yürütme performansını basit ama dahiyane bir yöntemle nasıl geliştirdikleri de ilginç bir detay:
Araştırmacılar, s1’in işini tekrar kontrol etmesini ve “düşünme” süresini uzatmasını sağlamak için akıllı bir yöntem kullandı: Modeli beklemeye söylediler. s1’in akıl yürütme sürecine “bekle” kelimesini eklemek, modelin biraz daha doğru yanıtlar vermesine yardımcı oldu, makaleye göre.
Bu bulgu, yapay zeka modellerinin yeterlilikte bir duvara çarptığına dair endişelere rağmen, hâlâ keşfedilecek birçok fırsatın olduğunu gösteriyor. Bilgisayar biliminin bazı dallarındaki önemli ilerlemeler, doğru büyülü kelimeleri bulmaktan ibaret olabiliyor. Ayrıca, kaba sohbet botlarının ve dil modellerinin ne kadar ilkel olduklarını da ortaya koyuyor; insan gibi düşünmüyorlar ve her konuda yönlendirilmelere ihtiyaç duyuyorlar. Onlar sadece olasılık ve sıradaki kelimeyi tahmin eden makineler ki, doğru hilelerle bir şekilde gerçeğe yakın cevaplar bulmak üzere eğitilebilirler.
OpenAI’nin, Çinli DeepSeek ekibinin model çıktıları üzerinde eğitim yapmasından rahatsız olduğu bildirildi. Çoğu insan için bu durum ironiyle karşılanıyor. ChatGPT ve diğer büyük modeller, webden izinsiz veri kazıyıcılarla eğitildi ve bu konuda hala mahkemelerde devam eden davalar var; örneğin New York Times gibi kuruluşlar, eserlerinin tazminatsız kullanılmasına karşı koymak istiyor. Google da teknik olarak S1 gibi rakiplerin Gemini’nin çıktıları üzerinde eğitim yapmalarını yasaklıyor ancak bu durumun Google’a fazla bir sempati kazandıracağı düşünülmüyor.
Sonuç olarak S1’in performansı etkileyici, ancak yalnızca 50 $’lık bir bütçeyle sıfırdan bir küçük model eğitilebileceği anlamına gelmiyor. Model temelde Gemini’nin eğitimi üzerine inşa edilmiş, bir tür kopya kağıdı almış. İyi bir benzetme, görüntü sıkıştırması: Bir AI modelinin sıkıştırılmış hali, bir fotoğrafın JPEG versiyonuna benzetilebilir. İyi, ama yine de kayıplı. Ve büyük dil modelleri, doğrulukla ilgili birçok sorunla halen boğuşuyor, özellikle tüm webi tarayarak yanıtlar üreten geniş ölçekli genel modeller. Görünüşe göre, Google gibi şirketlerdeki liderler bile AI tarafından üretilen metinleri gözden geçirirken doğrulama yapmıyor. Ancak S1 gibi bir model, Apple Intelligence için cihaz üzerinde işlem yapma gibi alanlarda faydalı olabilir (ki, bunun hala pek iyi olmadığını belirtmek gerekir).
Ucuz, açık kaynak modellerin yükselişinin teknoloji endüstrisi genelinde ne anlama gelebileceği konusunda pek çok tartışma var. Eğer modelleri herkes kolayca kopyalayabilirse, OpenAI mahkum mu? Şirketin savunucuları, dil modellerinin her zaman aracılardan biri olacağını savunuyor. OpenAI, Google ve diğerleri, modellerin üzerine inşa edilmiş kullanışlı uygulamalar geliştirerek başarıya ulaşacak. Her hafta 300 milyondan fazla insan ChatGPT kullanıyor ve ürün, sohbet botları ve yeni bir arama biçimi ile eş anlamlı hale geldi. Modellerin üzerindeki arayüzler, OpenAI’nın ağı dolayısıyla kullanıcı adına gezinmeler yapabilen bir arayüz, ya da xAI’nin X (eski adıyla Twitter) verilerine erişimi gibi benzersiz veri kümeleri, nihai farklılaştırıcılar olacak.
Diğer bir husus da “akıl yürütme”nin maliyetli kalması beklendiği. Akıl yürütme, modele verilen her bir kullanıcı sorgusunun işlenmesi süreci. Yapay zeka modelleri ucuzlayıp daha erişilebilir hale geldikçe, düşünce şudur ki, yapay zeka hayatımızın her anını etkisi altına alacak, bu da daha büyük bir işlem gücü talebi yaratacak, değil azaltacak. Ve OpenAI’nın 500 milyar dolarlık sunucu çiftliği projesi boşa gitmeyecek; böylece bu yapay zeka çılgınlığının sadece bir balon olmadığından emin olabileceğiz.