NVIDIA’dan Yenilikçi Yapay Zekâ Modeli: Fugatto
Hem donanım hem de yazılım alanında önemli bir oyuncu olan NVIDIA, yapay zekâ dünyasına yeni bir soluk getiren deneysel üretken yapay zekâ modeli Fugatto’yu (Foundational Generative Audio Transformer Opus 1) tanıttı. Bu model, ses için “İsviçre çakısı” olarak tanımlanıyor ve çok çeşitli uygulama alanları sunuyor.
Fugatto, ismi itibarıyla fugato teriminden esinlenmiştir. Bu terim, çok sesli ve tekrarlayan melodilerden oluşan müzik besteleme stilini ifade eder. Yapay zekâ modelinin bu isimle anılması tesadüf değildir; çünkü Fugatto, dünya genelinden gelen araştırmacılar tarafından geliştirilen, farklı aksanları ve dilleri algılayabilme yeteneğine sahip bir yapay zekâdır.
Sesleri İnsanların Anladığı Gibi Anlayacak
Bu konuda açıklamalarda bulunan NVIDIA Uygulamalı Ses Araştırmaları Yöneticisi Rafael Valle, “İnsanların sesleri anladığı ve ürettiği gibi anlayan bir model oluşturmak istedik.” şeklinde konuştu. NVIDIA, Fugatto’nun gerçek dünyadaki olası kullanım senaryolarını da duyurusunda detaylandırdı. Bu senaryolar arasında:
- Bir şarkı fikrinin prototipini oluşturma
- Farklı tarzlar, sesler ve enstrümanlar deneme
- Farklı ses tonları ve aksanlarla dil öğrenme
- Oyun geliştiricileri için ses varyasyonları üretimi
Ayrıca, Fugatto modeli, küçük ayarlarla daha önce eğitilmediği alanlarda da etkin bir şekilde kullanılabiliyor. Ancak, bu modelin kamunun erişimine açılıp açılmayacağı henüz netlik kazanmış değil. Daha önce benzer yapay zekâ modelleri Meta ve Google tarafından da geliştirilmişti, ancak Fugatto’nun sunduğu yenilikçi yaklaşım dikkat çekiyor.