Yapay Zeka Şirketinin Gizli Kitap İmha Projesi Ortaya Çıktı

Yapay Zeka Şirketinin Gizli Kitap İmha Projesi Ortaya Çıktı

Yapay zeka girişimi Anthropic, kamuoyundan gizli tutmaya çalıştığı ve 2024 başında başlattığı iddia edilen kapsamlı bir projeyle gündeme geldi. Bir telif hakkı davası kapsamında ortaya çıkan belgeler, şirketin "Project Panama" adını verdiği bu gizli planın, dünya üzerindeki milyonlarca kitabı fiziksel olarak tarayarak imha etmeyi hedeflediğini gözler önüne serdi. Bu durum, yapay zeka şirketlerinin veri toplama yöntemleri ve telif hakları konusundaki tartışmaları yeniden alevlendirdi.

"Project Panama": Kitapların Dijitalleştirilme Süreci

Mahkeme kayıtlarının gizliliğinin kaldırılmasıyla ortaya çıkan bir iç planlama belgesi, projenin amacını net bir şekilde ortaya koydu. Belgede, "Project Panama, dünyadaki tüm kitapları yıkıcı biçimde tarama çabamızdır. Bu proje üzerinde çalıştığımızın bilinmesini istemiyoruz" ifadesi yer alıyordu. Bu açıklama, şirketin faaliyetlerinin ne kadar gizli yürütüldüğünü ve amacının sadece dijitalleştirme olmadığını gösteriyor.

Milyonlarca Dolar Harcandı, Milyonlarca Kitap İmha Edildi

Washington Post'un yayınladığı mahkeme belgelerine göre, Anthropic yaklaşık bir yıl içinde milyonlarca dolar harcayarak milyonlarca kitabı satın aldı. Bu kitapların ciltleri kesilerek sayfaları tarandı ve elde edilen veriler, şirketin Claude dil modellerini eğitmek için kullanıldı. Daha önce kamuoyuna yansımayan bu detaylar, kitap yazarlarının Anthropic'e açtığı telif hakkı davasında yer alan 4 bin sayfalık bir belgede gün yüzüne çıktı. Yatırımcılar tarafından 183 milyar dolar değer biçilen şirket, ağustos ayında davayı 1,5 milyar dolar ödeyerek uzlaşmayla sonuçlandırmıştı. Ancak geçen hafta bir federal yargıcın dosyaları gizlilikten çıkarması, Anthropic'in kitaplara yönelik agresif veri toplama çabasını ayrıntılarıyla ortaya koydu.

Yapay Zeka Şirketlerinin Veri Açlığı

Bu belgeler, Meta, Google ve OpenAI gibi diğer büyük teknoloji şirketlerine açılan benzer davalardaki kayıtlarla birlikte, yapay zeka şirketlerinin yazılımlarını "eğitmek" için devasa veri yığınlarını elde etmek uğruna ne kadar ileri gittiklerini gösteriyor. Bu durum, yapay zeka teknolojisinin gelişiminin etik sınırlarını ve telif hakları konusundaki hassasiyetleri bir kez daha gündeme getiriyor.

Kitaplar "Altın Madeni" Olarak Görülüyor

Mahkeme kayıtlarına göre kitaplar, yapay zeka şirketleri için kritik bir kaynak olarak değerlendiriliyordu. Ocak 2023 tarihli bir belgede Anthropic'in kurucu ortaklarından biri, kitaplarla eğitilen modellerin "düşük kaliteli internet dili"ni taklit etmek yerine "iyi yazmayı öğrenebileceğini" savundu. Meta içinden 2024'te gönderilen bir e-postada ise dijital kitap arşivlerine erişim, rakip yapay zeka şirketleriyle rekabet edebilmek için "hayati" olarak nitelendirilmişti. Ancak belgeler, şirketlerin yayıncılardan ve yazarlardan doğrudan izin almayı pratik bulmadığını gösteriyor. Davalara göre Anthropic, Meta ve diğerleri, kitapları yazarların bilgisi olmadan toplu şekilde elde etmenin yollarını aradı; buna korsan kopyaların indirilmesi de dahil.

LibGen İndirmeleri ve Yasal Tartışmalar

Yeni açıklanan bir mahkeme belgesine göre Anthropic kurucu ortağı Ben Mann, Haziran 2021'de LibGen adlı korsan kütüphaneden 11 gün boyunca kurgu ve kurgu dışı kitaplar indirdi. Dosyalara giren ekran görüntülerinde Mann'ın dosya paylaşım yazılımı kullandığı görülüyor. Anthropic ise mahkemeye sunduğu savunmada, LibGen verilerinin gelir getiren ticari modellerin eğitiminde kullanılmadığını belirtti. Google, Microsoft ve OpenAI da benzer telif hakkı davalarıyla karşı karşıya. Davaların çoğu sürerken, iki erken kararda yargıçlar, kitapların yapay zeka eğitimi için kullanılmasının bazı durumlarda telif hukukundaki "adil kullanım" kapsamında yasal olabileceğine hükmetti.

Yargıçların Kararları ve Telif Hakkı İhlali

Haziran ayında Yargıç William Alsup, Anthropic'in kitapları "dönüştürücü" biçimde kullandığını belirterek, süreci öğretmenlerin öğrencilere yazı öğretmesine benzetti. Aynı dönemde Meta davasına bakan Yargıç Vince Chhabria, yazarların Meta'nın yapay zeka modellerinin kitap satışlarına zarar verdiğini kanıtlayamadığına hükmetmişti. Ancak şirketler, kitapları nasıl edindikleri tartışması nedeniyle yine de suçlamalarla karşı karşıya kalabiliyor. Anthropic'in milyonlarca korsan kitabı ücretsiz indirerek saklamasının telif ihlali oluşturabileceğine karar verildi. Bu nedenle yargıç, Anthropic'in LibGen gibi gölge kütüphanelerden indirdiği kitaplar için yazarların toplu dava açmasına izin verdi. Şirket ise suçu kabul etmeksizin 1,5 milyar dolar ödeme yapmayı kabul etti. Yazarlar, kitap başına yaklaşık 3 bin dolar talep edebilecek.

Kitapların Fiziksel Olarak Elde Edilmesi

Belgelere göre şirket, kitapları kütüphanelerden veya ikinci el kitapçılardan temin etmeyi değerlendirdi. Belgelerde New York'taki ünlü Strand Kitabevi'nin de seçenekler arasında olduğu görülüyor, ancak Strand kitap satışı yapılmadığını açıkladı. Anthropic sonunda milyonlarca kitabı, genellikle on binlerce kitaplık partiler hâlinde satın aldı. Tarama sürecinde kitapların hidrolik makinelerle kesildiği, sayfaların yüksek hızlı tarayıcılarla dijitalleştirildiği ve ardından kitapların geri dönüşüme gönderildiği belirtiliyor. Bu yöntem, hem veri toplama hem de fiziksel imha boyutunu gözler önüne seriyor.

Editör Notu: Yapay zeka teknolojisinin hızla geliştiği bu dönemde, veri toplama yöntemlerinin etik ve yasal sınırları büyük önem taşıyor. Anthropic'in gizli projesinin ortaya çıkması, bu alandaki şeffaflık ihtiyacını ve telif haklarının korunmasının gerekliliğini bir kez daha vurguluyor.