Meta, yapay zeka sistemlerini korsan içeriklerle eğitmekle suçlanıyor.
Meta, 2023 yılında geliştirdiği büyük dil modeli (LLM) Llama’nın yaratımında korsan içerikleri kullandığı iddiasıyla dava edildi. “Kadrey ve diğerleri v. Meta Platforms” olarak bilinen bu dava, yazarlar Richard Kadrey ve Christopher Golden tarafından açıldı. Yazarlar, Meta’nın telif hakkıyla korunan eserleri izinsiz kullanmakla suçluyor.
Amerika Birleşik Devletleri Kaliforniya Kuzey Bölgesi Bölge Mahkemesi Yargıcı Vince Chhabria, Meta tarafından mahkemeye sunulan ve bazı bölümleri gizlenmiş belgelerin kamuya açılmasına karar verdi. Açıklanan belgeler, Meta çalışanları arasında yapay zeka ve Llama ile ilgili yapılan tartışmaları sergiliyor.
Belgelerde, bir Meta mühendisinin “Meta’ya ait bir kurumsal dizüstü bilgisayardan torrent indirmek pek doğru gelmiyor” ifadesi yer aldı. Bu mesaj, şirketin yapay zeka eğitiminde korsan içeriklerden faydalandığını ortaya koyuyor. Ayrıca, “MZ” kısaltmasıyla belirtilen Meta CEO’su Mark Zuckerberg’in korsan materyallerin kullanılmasına onay verdiği de ima ediliyor.
Meta’nın yapay zeka eğitiminde LibGen gibi büyük bir korsan içerik kütüphanesini kullandığı iddia ediliyor. 2008 yılında Rusya’da kurulan LibGen, kitaplar, dergiler ve akademik makaleler gibi içerikler barındırıyor ve bu nedenle birçok telif hakkı davasına maruz kalmıştır. Ayrıca, Meta’nın diğer “gölge kütüphaneler” olarak bilinen kaynaklardan da faydalandığı öne sürülüyor.
Meta, bu iddialara karşı “adil kullanım” doktrini çerçevesinde kamuya açık materyalleri kullandığını savunuyor. Şirket, telif hakkıyla korunan içeriklerin dil modelleri oluşturmak ve orijinal ifadeler üretmek amacıyla kullanıldığını belirtiyor.
Meta, bu suçlamalarla karşılaşan ilk şirket değil
Büyük teknoloji şirketlerinin yapay zeka modellerini geliştirmek için telif hakkı ihlali yaptığına dair suçlamalar yeni değil. Örneğin, 2022 yılında yapılan bir araştırma, Apple’ın OpenELM modelinin 170.000’den fazla YouTube videosunun altyazılarını içerdiğini ortaya koydu. Ancak Apple, OpenELM’in yalnızca açık kaynaklı bir model olduğunu ve Apple Intelligence’ı desteklemek için kullanılmadığını bildirdi. Şirket, yapay zeka eğitiminde lisanslı ve kamuya açık veriler kullandığını vurguladı.
Öte yandan, The New York Times ve The Atlantic gibi büyük yayın kuruluşlarının içeriklerini Apple Intelligence’ın eğitimine sunmamayı tercih ettiği biliniyor.