Meta’nın Yeni Yapay Zekâ Modelleri ve Tartışmalar
Meta, yeni yapay zekâ modellerini duyurdu ancak bu süreçte bazı karmaşalar ortaya çıktı. Şirketin, yapay zekâsını rakiplerinden daha üstün göstermek amacıyla test sonuçlarını biraz “kendi lehine” manipüle ettiği iddiaları gündeme geldi. Kısacası, Meta’nın yapay zekâsı daha zeki gibi görünüyordu, ancak bu görünümün arkasında bazı hileler yatıyordu.
Şirketin Llama 4 serisinde yer alan Maverick modeli, yapılan testlerde oldukça yüksek puanlar almasına rağmen, bu sonuçların kamuya açık versiyonu ile örtüşmediği ortaya çıktı. Testte görünen Maverick ile halka sunulan modelin aynı olmadığı belirtildi.
Meta, hafta sonu yaptığı açıklamada Llama 4 kapsamında iki yeni yapay zekâ modelini tanıttı. Bu modellerden özellikle Maverick’in, rakipleri olan GPT-4o ve Gemini 2.0 Flash’ı geride bıraktığı ifade edildi. LMArena isimli popüler karşılaştırma platformunda ikinci sıraya yükselen Maverick, 1417 ELO puanıyla dikkat çekti.
Ancak kısa bir süre sonra ortaya çıkan detaylar, test edilen Maverick’in kamuya açık versiyondan farklı olduğunu gözler önüne serdi. Meta’nın belgelerinde, LMArena’da kullanılan modelin “konuşma yetenekleri için özel olarak optimize edilmiş deneysel bir sürüm” olduğu belirtildi. Bu durum, platform yöneticilerinin tepkisini çekti ve kuralların gözden geçirileceği açıklandı.
Meta, bu özel sürümün kullanımını savunarak, geliştiricilerin açık kaynaklı versiyonu kendi ihtiyaçlarına göre özelleştirebileceğini vurguladı. Ancak test platformunda gösterilen performans ile halka sunulan model arasındaki fark, gerçek dünyada alınabilecek verimin sorgulanmasına neden oldu. Ayrıca, şirketin modelin beklenen performansı gösteremediği için daha önce birkaç kez ertelediği de biliniyor.
Yaşanan bu gelişmeler, yapay zekâ karşılaştırma testlerinin şeffaflık ve güvenilirlik açısından önemini bir kez daha gündeme taşıdı. Aynı zamanda, modellerin test koşulları ile kullanıcıya sunulan versiyonları arasındaki farklar, geliştiricilerin karar alma süreçlerini de etkileyebiliyor.