Zuckerberg LLAMA AI dil modellerini korsan verilerle eğitti! Meta'ya davalar yağdı
Meta CEO'su Mark Zuckerberg'in, şirketin yapay zeka modelleri ekibine korsan e-kitaplar ve makalelerle eğitim izni verdiği iddiası gündemde. Bu iddialar üzerine açılan davalarda gizlilik talebi reddedildi ve şirket iç yazışmaları da gündeme düştü
ABONE OLYapay zekanın gelişiminde büyük dil modellerinin (LLM) eğitimi, modern teknolojinin en önemli ve hızlı ilerleyen alanlarından bir tanesi olarak dikkat çekiyor. Bu modeller, devasa miktarda metin verisi üzerinde eğitim alarak, doğal dil işleme ve anlama görevlerinde inanılmaz bir performans sergiliyor. Büyük dil modelleri, dil tabanlı birçok uygulamada yenilikçi çözümler sunarak, insan-makine etkileşimini daha doğal ve etkili hale getiriyor. Ancak, bu modellerin eğitimi sırasında kullanılan veri setlerinin kaynağı ve telif hakları, önemli etik ve yasal soruları da beraberinde getiriyor.
Meta CEO'su Mark Zuckerberg'in de bu konuda başı dertte. Zuckerberg'in şirketin LLAMA (Large Language Model Meta AI) yapay zeka modelleri ekibine, korsan e-kitaplar ve makaleler içeren bir veri setini kullanma izni verdiği iddiaları gündemde. Meta'ya karşı açılan Kadrey v. Meta davasında, Zuckerberg'in LibGen adlı veri setini Llama ile ilgili eğitim için kullanmaya onay verdiği belirtiliyor. Bu dava, Meta gibi büyük teknoloji şirketlerinin, yapay zeka modellerini telif hakkıyla korunan eserlerle izin almadan eğitmekle suçlandığı davalardan sadece bir tanesi.
LibGen, telif hakkıyla korunan eserleri yayınlayan bir platform olarak birçok kez dava edildi ve milyonlarca dolar para cezasına çarptırıldı. Davacıların avukatlarının iddialarına göre, Meta çalışanları, LibGen'in "korsan bir veri seti" olduğunu biliyordu ve bunun Meta'nın düzenleyicilerle müzakeredeki konumunu zayıflatabileceğini belirttiler. Meta'nın savunması ise, ABD'nin fair use (adil kullanım) doktrini kapsamında, telif hakkıyla korunan eserleri "yeterince dönüştürücü" bir şekilde yeni bir şey oluşturmak için kullanılabileceğini iddia ediyor.
Meta'nın iç yazışmalarında, şirketin bu veri setini kullanmak için Zuckerberg'in onayını aldığı belirtiliyor. Ayrıca, Meta'nın veri setindeki telif hakkı bilgilerini kaldırmak için bir script yazdığı ve böylece olası telif hakkı ihlallerini gizlemeye çalıştığı iddia ediliyor. Meta mühendislerinin, veri setindeki telif hakkı ve kaynak bilgilerini kaldırdığı belirtiliyor.
Meta'nın LibGen'i torrentleyerek başka bir telif hakkı ihlaline de karıştığı iddialar arasında. Torrentleme, dosyaların web üzerinde dağıtılmasını sağlar ve bu süreçte Meta'nın da LibGen içeriğini yaydığı ileri sürülüyor. Meta'nın baş mühendislerinden Ahmad Al-Dahle'nin, torrentleme konusunda endişeleri olan çalışanlarının çekincelerini dikkate almadığı ve torrentleme yolunu açtığı iddia ediliyor.