Yapay Zeka

Korsan Kitap Veri Tabanını Araştır: Trump Yerel Kütüphaneni Yok Ederken aju0116 kasım 7ışına Çık!

Ücretsiz edebiyata erişimimiz iki uçtan suistimal ediliyor: Bir tarafta teknoloji milyarderleri tarafından ele geçirilen ABD hükümeti, diğer tarafta bazı milyarderler ve diğer büyük teknoloji şirketleri. Meta gibi şirketler tarafından geliştirilen yapay zeka, korsan sitelerden milyonlarca kitabı yuttu. Ancak yapay zeka tarafından oluşturulan çöp içerikleri okumak istemiyorsanız, Donald Trump yönetimindeki federal hükümet, kamu kütüphanelerinin finansmanı için ana kaynaklardan birini öldürmeyi düşünüyor. Okumayı seviyorsanız, bu kötü bir zaman.

Son iki yılda, The Atlantic, yapay zeka eğitimi için kullanılan herkese açık veri havuzlarını analiz edip bu konuda raporlar hazırlamaktadır. Site, LibGen adındaki korsan medya arşivine odaklanmıştır; bu arşiv, milyonlarca kitap, akademik makale ve diğer makaleleri içermektedir. Yakın zamanda site, bulgularını yayınladı ve milyonlarca korsan içeriği aramanıza olanak tanıyan bir araç sundu. Bu sayede, favori yazarlarınızı bulabilir ve eserlerinin OpenAI, Mistral ve Meta gibi kuruluşların yapay zeka modellerini eğitmek için kullanılıp kullanılmadığını görebilirsiniz.

LibGen, tam adıyla Library Genesis, çevrimiçi “gölge kütüphane” olarak adlandırılır. Açık ama yasadışı yapısı nedeniyle böyle bir ad verilmiştir. The Atlantic’e göre, neredeyse 7,5 milyon kitap ve 81 milyon akademik makale içermektedir. Kapsadığı telif hakkına sahip materyallerin dışında, toplum için sunduğu gerçek faydalar göz ardı edilemez. Library Genesis, bilim insanlarının akademik çalışmalara maliyetli yayın ücretleri ödemeden erişmesini sağlar. Sci-Hub gibi diğer gölge kütüphaneler, Elektronik Sınır Vakfı gibi gruplar tarafından bilimsel ilerleme için değerli kabul edilmiştir.

Gizmodo, yorum almak için Meta ile iletişime geçti ancak hemen yanıt alamadık. Aynı zamanda, LibGen kullanımı hakkında yorum almak için Mistral ve OpenAI ile iletişime geçtik. OpenAI’dan bir sözcü Gizmodo’ya, “Bugün ChatGPT ve API’mizi güçlendiren modeller bu veri setleri kullanılarak geliştirilmedi. Bu veri setleri, artık OpenAI ile çalışmayan eski çalışanlar tarafından 2021 yılında kullanıldı.” ifadesinde bulundu.

Ancak LibGen artık OpenAI çalışmalarının merkezinde olmasa da, AI şirketlerinin durumu ve konumları açıkça ortadadır. Geçen yıl, eski bir OpenAI çalışanı şirketin telif hakkı yasasını çiğnediğini hissettiğini belirtmiş ama OpenAI, yapay zekayı eğitmek için telif haklarıyla korunan eserlerin kullanılmasının adil kullanım olduğunu iddia ederek mahkemede kendisini savunmuştu. The Verge gibi siteler, Meta’nın OpenAI ve Mistral’i geride bırakmak için LibGen kullanma planlarını zaten ele almıştı. Komedyen Sarah Silverman tarafından oy birliğiyle onaylanan son mahkeme kayıtları, Meta kıdemli araştırmacısı Melanie Kambadur’un AI eğitimi için “kitapların aslında web verilerinden daha önemli olduğunu” söylediğini ve bu yüzden kitaplara “ASAP” (çok acele) ihtiyaç duyduğunu belirtiyor. Daha fazla belge, şirket çalışanlarının yapay zekayı eğitmek için kitap lisanslamayı düşündüğünü ancak bunun yerine korsan bir arşiv kullanmayı tercih ettiklerini ortaya koyuyor. Bir mühendislik direktörü, “tek bir kitabı” lisanslarsak, yasal “adil kullanım” argümanını kullanamayacaklarını belirtti.

Bluesky Michael Livingstone Libgen
© Bluesky / Michael Livingston

Kitapların bu açıktan kullanımının ne kadar yukarıya çıktığını merak ediyorsanız, başka bir e-posta belgesi, nihai karar verici olarak CEO Mark Zuckerberg’i işaret edebilecek “MZ’ye yükseltme”den bahsediyor. The Atlantic, Meta’nın bir torrent kullanarak LibGen’i indirdiğini ve bunun telif hakkı yasalarına doğrudan bir saldırı olarak dosyaları başkalarına tohum olabileceğini iddia ediyor. Meta, diğer taraftan Llama AI modelinin 1 milyar kez indirildiğini dolaylı yoldan duyurdu.

Yapay zekanın telif hakkıyla korunan verileri tüketmesinin yasal olup olmadığı konusunda hukuk hala bir karar vermemiş olsa da, yaratıcı topluluğun nerede durduğu açıktır. Michael Chabon, yapıtının yapay zeka eğitimi için kullanıldığı iddiasıyla Meta’ya dava açtı. The Atlantic’in son açıklamaları yazarları hiç mutlu etmedi. Yazar Michael Livingston, Bluesky üzerinden yaptığı açıklamada, 16 kitabı ve daha birçok makalesinin Llama 3 için kullanıldığını belirtti. Nebula ödüllü yazar Aliette de Bodard, “tüm kitaplarım LibGen’de, ve bundan memnun değilim” dedi.

Keith Sonderling Us Dept Of Labor
Keith Sonderling, ABD Başkanı Donald Trump’ın Çalışma Bakan Yardımcısı ve IMLS’nun geçici direktörü olarak aday gösterildi. © Win McNamee / Getty Images)

Kitapların korsan olarak yapay zeka eğitimi için kullanılması ironisi, Başkan Donald Trump’ın yönetimi kamu kütüphanelerini mali olarak destekleyen aparatı yok etmeye çalışırken, insanlara ait birçok hizmeti yapay zekaya yükleyerek yapılıyor. 14 Mart’ta Trump, Müzeler ve Kütüphane Hizmetleri Enstitüsünün fiilen işleyişini sona erdirecek bir yürütme emri yayımladı. Enstitü, ABD genelindeki kütüphanelere hibe ve diğer finansal destek sağlar. Aynı gün Trump, bu pozisyona Keith E. Sonderling’i atadı.

Devlet ve yerel vergiler genellikle kütüphanelerin finansmanına yardımcı olurken, ABD’deki birçok kurum, temel hizmetler için federal hibe desteğine güvenir. Bu destek, kütüphanelerin tanıttığı dijital hizmetleri de kapsar. Böylece kullanıcılara yerel kütüphanelerden e-kitap veya sesli kitap ödünç almalarına izin veren Libby ve Hoopla gibi uygulamalara erişim sağlanır. Hoopla Digital Başkanı Jeff Jankowski, NPR’ye verdiği bilgide, “federal fon olmadan bazı kütüphaneler dijital hizmetlerini azaltabilir veya tamamen sonlandırabilir,” demişti. E-kitapların yayınlanması için daha uzun bekleme süreleri bekleyin veya okumayı umduğunuz bir kitabın hiç mevcut olmadığını görebilirsiniz.

Musk ve DOGE, işten çıkarılacak personelin yerine yapay zekayı getirmenin devleti daha verimli hale getireceğini düşünüyor. Kesinlikle chat botlar bir ileti üzerine yanıtlar üretebiliyor, ancak bir federal ajans tam kadro çalıştığında yapabilecek hiçbirini yapay zekanın başarabileceği olası görünmüyor. Bu teknoloji milyarderlerinin tüm bu müdahalelerinin sonucunda, önce yazarların eserlerini çalarak kitap endüstrisini sekteye uğratacaklar, ardından insanların kitaplara erişimini tamamen kısıtlayacaklar.

Bir yanıt yazın