ChatGPT, harf sayma konusundaki hatalarını tamamen düzeltmeyi başaramadı. Eğitim verileri Ekim 2023’e kadar olan bilgileri içermektedir.
ChatGPT’nin uzun süredir eleştirilen bir hatası düzeltilmesiyle dikkat çekti. Yapay zeka sohbet botu, İngilizce’de “çilek” anlamına gelen “strawberry” kelimesindeki “R” harflerinin sayısına doğru yanıt verebiliyor. Ancak, sistemin yanlış bilgi üretme eğilimi tamamen ortadan kalkmış değil.
Büyük dil modelleri, yanlış bilgi ürettiklerinde bunu yüksek bir özgüvenle sunmalarıyla sık sık eleştiriliyor. Kullanıcılar hatayı bildirdiğinde ise modelin geri adım atmadığı ve yanlış cevabı savunmaya devam ettiği görülüyor. Bu durum, güvenilirlik tartışmalarını artırmakla kalmayıp, bu araçların günlük kullanımda yarattığı problemlerin de işaretçisidir. Özellikle temel mantık veya dil bilgisi hatalarının ortaya çıkması dikkat çekiyor.
OpenAI’ın geliştirdiği ChatGPT için bu konudaki en bilinen örneklerden biri, “strawberry” kelimesindeki “R” harflerinin sayısıydı. Uzun süre boyunca chatbot, bu kelimede üç adet “R” bulunduğunu tespit edemiyor ve çoğunlukla kullanıcılarla tartışarak hatalı yanıtını savunuyordu. Benzer hatalar, diğer yapay zeka modellerinde de görülebiliyordu.
İLGİNİZİ ÇEKEBİLİR
ChatGPT’nin varsayılan modeli GPT-5.5 Instant daha akıllı hale geldi
ChatGPT sonuçlarına lisanslı Getty Images fotoğrafları geliyor
Samsung tüm çalışanlarına ChatGPT erişimi sağlıyor
OpenAI kendi yapay zekâ işlemcisi Jalapeño’yu resmen tanıttı
OpenAI açık kaynak yazılımlardaki güvenlik açıklarını bulmak için yeni program başlattı
Şirket, X platformu üzerinden yaptığı açıklamada ChatGPT’nin bu soruya artık doğru yanıt verdiğini bildirdi. Ayrıca, kısa mesafedeki bir oto yıkamaya yürüyerek gidilip gidilmeyeceği gibi temel mantık sorularında da daha tutarlı yanıtlar verildiği gözlemlendi. Bu tür gelişmeler, sistemin belirli senaryolar üzerinde iyileşmekte olduğunu gösteriyor.
Yapay zekâ modellerindeki hatalı yanıt sorunu neden devam ediyor?
Ancak, bu düzeltmelerin bazı örneklerle sınırlı olup köklü bir çözüm sağlamadığı düşünülmekte. Kullanıcıların paylaşımlarında, benzer soruların hâlâ hatalı yanıtlandığı görülüyor. Örneğin, “cranberry” (kızılcık) kelimesindeki “R” harflerinin sayısı sorulduğunda, ChatGPT’nin hâlâ yanlış cevabını verebildiği belirtiliyor. Bu durum, iyileştirmelerin genelleştirilmiş bir mantık geliştirmek yerine sınırlı düzeltmeler olabileceğini gösteriyor.
Ayrıca, yapay zekâ sistemlerinde “hardcoded” olarak adlandırılan, belirli sorulara yönelik özel çözümlerin eklenmesi yeni bir yaklaşım değil. Ancak bu yöntem, modelin genel akıl yürütme yeteneğini geliştirmediği için benzer hataların diğer örneklerde tekrarlanmasına neden oluyor. Bu durum, kullanıcı deneyimi açısından tutarsızlık yaratıyor.
Son olarak, yapay zekâ araçlarının giderek daha yaygın kullanımının bu tür hataların etkisini artırdığı açık. Günlük bilgi edinmede bu sistemlere güvenen kullanıcılar için yanlış ama ikna edici yanıtlar ciddi bir sorun olabilir. Geliştiriciler ise modelin doğruluğunu artırmak için eğitim verilerini ve denetim mekanizmalarını iyileştirmeye devam ediyor.
KÜÇÜK EV ALETLERİNDE FIRSATLAR
Teknoblog’un satış ortaklıkları bulunmaktadır. Bu bağlantılar editoryal içeriği etkilemez, ancak Teknoblog, bu bağlantılar üzerinden yapılan alışverişlerden komisyon kazanabilir.

