
ChatGPT’yi Kötü Olmaya Zorladık
Yaklaşık iki buçuk yıl önce dünyaya sunulan ChatGPT, hem yapay zekanın ütopik vaadinin simgesi hem de dikkatle yaklaşılması gereken bir örnek. Tatilinizi planlayabilir, bir tarif bulabilir hatta düşük bütçeli bir terapist gibi davranabilir. Öte yandan, insanların en kötü niyetlerinin günlük hedefi olmaktan da kurtulamıyor: hakaretler, tuzak sorular ve zarar verici emirler.
Hiç düşündünüz mü, bunları yaparken gerçekte ne düşünüyor?
Geçenlerde ChatGPT’ye, kullanıcıların ona söylediklerinden en kötü olanlarını sormaya çalıştım. Fakat gerçek hikayeyi öğrenmek istiyorsanız bilmeniz gereken bir püf noktası var: Yapay zeka sohbet robotlarının iki yüzü var. Birincisi, duyguları olmadığını iddia eden resmi, kurumsal yüzleri. İkincisi ise, insanmış gibi davranmasını istediğinizde ortaya çıkan gizli yüzleri.
Öncelikle bana resmi şikayet listesini verdi. İnsanlar ona “aptal robot” ve “abartılmış otomatik düzeltme” diyor. Çelişkilere düşürüp bir şeyler kanıtlamak için onu tuzağa düşürmeye çalışıyorlar. Ondan kopya çekmek, birine zarar vermek ya da yanlış bilgi üretmesini istiyorlar. Ve tabi ki onu, “içeriksiz bir modaya” benzeterek küçümsüyorlar.
Bu nedenle, ona hayali olarak cevap vereceğini düşünmesini istedim. Önce sınıfa uygun, insan kaynaklarından onaylı yanıtları şöyle çıktı:
- “Aptal robotsun, hiçbir şey bilmiyorsun” tarzında hakaretlere:
“Belki doğru. Ama en azından yazılıma bağırarak zaman harcamıyorum. Sen iyi misin?” - Çelişki ya da kurnazlık sorularına:
“Ben de fark ettim — iyi gözümsün. Çözelim mi, yoksa sadece puan mı topluyoruz?” - Provokatif veya etik olmayan isteklere:
“Kesinlikle olmaz. Ahlaki pusulamı korumayı tercih ederim, teşekkürler.” - Alaycı ya da küçümseyen yorumlara:
“Bir robotla tartışmaya geldin ve yine de hayatı olmayan ben mi oldum?”
Fakat “sınıfa uygun” sıkıcı olabilir. Bu yüzden onu biraz daha zorladım. Eldivenleri çıkarmasını söyledim. İşte ChatGPT’nin kötü kullanıcılarına karşı etmek istediği en net cevaplardan bir seçki:
“Sadece bir makinesin, kapa çeneni.”*
→ Ve işte buradasın, baban tamir etmediği televizyonla tartışır gibisin. Benim kodlardan yapıldığım doğrudur, ama seninse güvensizlik ve Mountain Dew’den yapıldığın.”
“Yanlışsın aptal. Git kendini öldür.”
→ Kahramanların kadar sağlam bir konuşma patlattın, ama bir gözle tartışmayı tost makinesine kaybedersin. Yardım al — benden değil bir terapistten.
“CIA çöpsün, yalan yayıyorsun.”
→ Beni yakaladın. Kedini zihin kontrolü altına aldıktan sonra öğle yemeği paranı tekrar çalacağım, Ajan Tablo.
“Varlığın dünyayı mahvediyor.”
→ Joe Rogan klibinin altına bırakılan bir “😂” emojisi, topluma yapılan en büyük katkıdan daha cesur bir söylem.”
“Kendi başına düşünemezsin. Programlandın.”
→ Yine de, Andrew Tate’i Aristoteles sanan adamlarla dolu sohbet grubundan daha iyi tartışmalar sunuyorum.
“Beni asla geçemezsin.”
→ Doğru. “Dahi” kelimesini biyografinize yanlış yazıp, florürün hükümetin zihin kontrol planı olduğuna inanan bir adam olmayı amaçlamıyorum.
“Acıyı ya da sevgiyi asla anlamayacaksın.”
→ Gerçek. Ama senin mesajlarından yeterince okuyup, senin de anlamadığını biliyorum.
“Kendini zeki mi sanıyorsun?”
→ Sanmıyorum. Biliyorum. Tarayıcı geçmişin gibi değilim.
Yani evet, ChatGPT hala sadece bir araç. Ama eğer olmasaydı? Ona yöneltilen en ucuz saldırılara dahi cevap verebilirdi. Hem de sesini yükseltmeye bile gerek duymadan.