Alibaba’dan Yeni Yapay Zekâ Modeli: Qwen2.5-Max
Bir süredir yapay zekâ alanındaki çalışmalarını hızlandıran Çinli e-ticaret devi Alibaba, yeni yapay zekâ modeli olan Qwen2.5-Max‘ı duyurdu. Bu modelin, Qwen2.5 üzerine inşa edildiği bildiriliyor ve Alibaba’nın, Çinli yapay zekâ girişimi DeepSeek karşısında tedirgin olmaya başladığını gösteriyor. Duyuru, Çin’de tatil dönemine girilen bir zamanda gerçekleştirildi ve bu, şirketin rekabetçi bir dönüşüm içinde olduğunu ortaya koyuyor.
Alibaba’nın WeChat üzerinden yaptığı duyuruya göre, Qwen2.5-Max, rakipleri olan DeepSeek-V3, GPT 4o ve Llama-3.1-405B modellerinden daha iyi bir performans sergilediğini iddia ediyor. Şirket, bu açıklamayı yapabilmek için yeni yapay zekâ modelini çeşitli testlere tabi tuttu ve elde edilen sonuçlar, sunulan iddiaların doğruluğunu kanıtlar nitelikte.
İşte Qwen2.5-Max için yayımlanan test sonuçları:
- Arena-Hard testinde en etkileyici performansı gösteren model, rakiplerini geride bırakarak birinci oldu.
- LiveBench testinde de tüm rakiplerini geride bırakan Qwen2.5-Max, MMLU-Pro testinde üçüncü, GPQA-Diamond ve LiveCodeBench testlerinde ise ikinci sırada yer aldı.
- Arena-Hard testi, insan tercihlerini tahmin etmeye yönelik bir yapı içeriyor. Bu da Qwen2.5-Max’in, diğer yapay zekâ modellerine kıyasla insan gibi düşünebilme yeteneği ile öne çıktığını gösteriyor.
Alibaba, bu yeni yapay zekâ modeline Owen Chat arayüzü üzerinden erişim sağladığını duyurdu. Kullanıcılar, yeni modelin gerçek kullanımda neler sunacağını yapacakları testler ile keşfedecekler.