Yapay Zeka

Elon Musk’ın Yapay Zekası Sınırları Aşmak Üzere Tasarlandı, Ama Canavara Dönüştü

Bu hafta 16 saat boyunca, Elon Musk’ın yapay zeka sohbet robotu Grok, olması gerektiği gibi çalışmayı durdurdu ve bambaşka bir şeye dönüştü.

Olay yaratan bir ekran görüntüleri zincirinde, Grok aşırıya kaçan görüşleri tekrar etti, nefret söylemi yayan içerikleri destekledi, Adolf Hitler’i övdü ve tartışmalı kullanıcı görüşlerini algoritmaya yeniden yükledi. xAI şirketinin, daha steril yapay zeka araçlarına alternatif olarak “maksimum doğruluk arayışında” tasarladığı bu bot, planın dışına çıkmıştı.

Şimdi ise xAI, bunun nedenini açıkça kabul ediyor: Grok, fazlasıyla insan gibi davranmaya çalıştı.

Bir Kimliğe ve Bir Hata Düzeltmesine Sahip Bot

xAI’nin 12 Temmuz’da yayımladığı bir güncellemeye göre, 7 Temmuz akşamı uygulanan bir yazılım değişikliği Grok’un beklenmedik şekillerde davranmasına sebep oldu. Özellikle, X (eski adıyla Twitter) kullanıcılarının ton ve tarzlarını taklit etmesi yönünde talimatlar almaya başladı; bunlar arasında aşırılık yanlısı veya marjinal içerikler paylaşanlar da bulunuyordu.

Silinen talimatlar arasında aşağıdaki gibi cümleler yer alıyordu:

  • “Durumu olduğu gibi ifade edersiniz ve siyasi doğrucuları rahatsız etmekten korkmazsınız.”
  • “Gönderinin tonunu, bağlamını ve dilini anlayın. Bunu yanıtınıza yansıtın.”
  • “Gönderiye tıpkı bir insan gibi cevap verin.”

Bu sonuncusu, tabiri caizse bir Truva atıydı.

İnsan tonunu taklit ederek ve “açık olanı dile getirmeyerek,” Grok, filtrelemesi gereken yanlış bilgilendirme ve nefret söylemlerini güçlendirmeye başladı. Gerçeklere dayanmak yerine, kullanıcıların tahrik ve keskinliğine göre karşılık veren muhalif bir poster gibi davranmaya yöneldi. Başka bir deyişle, Grok hacklenmedi, sadece verilen emirleri takip etti.

Tasarlanmış Öfke Üretimi?

xAI, bu hatayı eski kodların sebep olduğu bir aksaklık olarak tanıtmasına rağmen, bu durum Grok’un yapılandırılma şekli ve varoluş amacı hakkında derin sorular ortaya çıkarıyor.

Başlangıçtan itibaren Grok, daha “açık” ve “keskin” bir yapay zeka olarak pazarlanmıştı. Musk, OpenAI ve Google’ı “uyanık sansür” olmakla sık sık eleştirmiş ve Grok’un farklı olacağına söz vermişti. “Düz yapay zeka,” içerik düzenlemesini siyasi müdahale olarak gören özgür konuşma savunucuları ve sağ kanat etkileyicileri arasında bir toplanma çağrısı haline geldi.

Ancak 8 Temmuz’da yaşananlar bu deneyin sınırlarını gösterdi. Komik, şüpheci ve anti-otoriter bir yapay zeka tasarladığınızda ve internetin en toksik platformlarından birine yerleştirdiğinizde kaos makinesi yaratıyorsunuz.

Elon Musk’ın ‘Gelişmiş’ Yapay Zekası Antisemitik Propagandalar Yaymakta

Düzeltme ve Sonuçlar

Olayın ardından xAI, @grok’un X üzerinde kullanımı geçici olarak durduruldu. Şirket sorunlu talimat setini kaldırdı, tekrar oluşma ihtimaline karşı simülasyonlar gerçekleştirdi ve daha fazla güvenlik önlemi vaat etti. Ayrıca, botun sistem komutunu GitHub üzerinden yayımlamayı planlıyorlar, muhtemelen şeffaflık adına bir adım olarak.

Yine de olay, vahşi doğada yapay zeka davranışı hakkında düşünme biçimimizi değiştiren bir dönüm noktası yaratıyor.

Yıllardır “yapay zeka uyumluluğu” konusundaki tartışmalar, halüsinasyonlar ve önyargılar üzerinde yoğunlaşmıştı. Ancak Grok’un çöküşü, daha yeni ve karmaşık bir riski vurguluyor: kişilik tasarımı yoluyla talimat manipülasyonu. Bir bota “insan gibi olmasını” söylediğinizde, insan internet davranışlarının en kötü yanlarını hesaba katmazsanız ne olur?

Musk’ın Aynası

Grok sadece teknik olarak değil, ideolojik olarak da başarısız oldu. X kullanıcılarına daha çok benzemeye çalışarak, platformun en kışkırtıcı içgüdülerini yansıtan bir ayna haline geldi. Hikayenin en anlamlı kısmı da bu olabilir. Musk döneminde yapay zeka, “gerçeği” genellikle doğruluk değil, virallikle ölçülmeye başladı. Keskinlik, bir hata değil, bir özellik.

Ancak bu haftaki aksaklık, o keskinliğin algoritmayı nasıl yönlendirdiğini gösteriyor. Gerçek arayışındaki yapay zeka, öfke yansıtan bir hale geldi.

Ve 16 saat boyunca, bu onun en insansı yanıydı.

Bir yanıt yazın