Reddit, Wayback Machine’e Geçit Vermiyor: Forumlar Artık Arşivlenemeyecek!

Reddit, Internet Archive’ın Wayback Machine’ini, yapay zeka şirketlerinin dijital zaman kapsülünden verileri kopyaladığını fark ettikten sonra, sitesinin çoğunu indekslemesini engelliyor.

Bu hamle, Reddit’in kullanıcı verilerini daha sıkı kontrol altına almak istemesiyle dikkat çekiyor. Şirket, yapay zeka firmalarının Reddit gönderilerinde modellerini eğitmesine itiraz etmiyor, ama bunun için öncelikle bir ödeme yapılmasını istiyor. Reddit daha önce, Internet Archive gibi “iyi niyetli aktörler”i kısıtlamayacağını belirtmişti, ancak şimdi bu aktörlerin bazılarının yapay zeka firmalarına lisans ücretlerinden kaçmak konusunda yardımcı olduğuna inanıyor. Reddit’in bu ani karar değişikliği, veri lisanslamasının yapay zeka çağında nasıl büyük bir gelir kaynağı haline geldiğini gösteriyor.

Internet Archive, web siteleri ve diğer çevrimiçi içeriklerden oluşan geniş bir dijital kütüphane oluşturmayı amaç edinen kar amacı gütmeyen bir kuruluş. Şimdiye dek milyarlarca web sayfası, milyonlarca kitap, video ve yazılım programı arşivledi. En bilinen aracı olan Wayback Machine sayesinde kullanıcılar, geçmişte web sayfalarının nasıl göründüğüne dair anlık görüntüleri kaydedip, daha sonra bu tarihler üzerinden sayfalara yeniden göz atabiliyor.

Reddit, bazı yapay zeka şirketlerinin Reddit politikalarını baypas ederek Wayback Machine aracılığıyla kullanıcı içeriklerini izinsiz kopyaladıklarına dair kanıtları olduğunu söylüyor.

Reddit sözcüsü Gizmodo’ya yaptığı e-posta açıklamasında, “Internet Archive, açık web’e bir hizmet sunuyor, ancak bazı yapay zeka şirketlerinin platform politikalarımız dahil olmak üzere, ihlal ettiğine ve Wayback Machine’den veri kopyaladığının farkına vardık. Platform politikalarına uyup (örneğin, kullanıcı gizliliğine saygı gösterme, kaldırılmış içeriğin silinmesi gibi) kendilerini savunarak web sitelerini koruyana kadar, Reddit verilerine erişimlerini kısıtlıyoruz,” dedi.

Reddit, The Verge‘e, Wayback Machine’in artık gönderi ayrıntı sayfalarını, yorumları veya profilleri tarayamayacağını, fakat sadece Reddit’in ana sayfasını indekslemesine izin verileceğini belirtti. Bu sınırlamalar bugünden itibaren “aşamalı olarak” uygulanmaya başlanıyor ve Reddit, Internet Archive’a önceden bilgi verdiğini belirtiyor.

Internet Archive, Gizmodo’nun yorum talebine hemen yanıt vermedi.

Son yıllarda Reddit, verilerine erişimi daha sıkı kontrol etmeye başladı. Şirket, verilerini lisanslamaya açık olmasına rağmen, bunun için ödeme yapmayan şirketlerle mücadele ediyor. Şirket, şimdiden Google ve OpenAI ile çok milyon dolarlık anlaşmalar yaptı. Google anlaşmasında, Reddit hem arama dizinleme hem de yapay zeka eğitimi için Google ile ortaklık yaptı, ardından diğer arama motorlarının son Reddit gönderilerini arama sonuçlarında göstermesini engellemeye başladı.

Haziranda Reddit, yapay zeka girişimi Anthropic’i izinsiz veri kopyalamakla suçlayarak dava açtı.