Yapay zekâ alanındaki atılımlarını hızlandıran Google, geçtiğimiz günlerde bir dizi heyecan verici duyuru gerçekleştirdi. Bu duyurular arasında, OpenAI’ın Sora’sına rakip olabilecek yeni video oluşturma aracı Veo 2 dikkat çekti. Ancak Veo 2’nin yanı sıra, yeni ve yenilikçi bir yapay zekâ aracı olan Whisk de tanıtıldı.
Whisk, temelde görsel oluşturma amacı güden bir yapay zekâ aracı olarak öne çıkıyor. Diğer benzer araçlardan farklı olarak, görselleri komut olarak kullanarak yeni görseller oluşturma yeteneğine sahip. Bu özellik, kullanıcıların metin komutlarına bağımlılığını en aza indiriyor.
Görseller ve Metinle İstediğiniz Sonuçları Ortaya Çıkarın
Kullanıcılar, Whisk’i kullanarak yapay zekâya istedikleri şeyi gösterebilirler. Bunun için ana ögeyi, detayları ve stili görseller aracılığıyla ifade edebilme imkanına sahipsiniz. Ayrıca, sadece tek bir görsel kullanma zorunluluğu da yok. Birden fazla görseli referans alarak, arzu ettiğiniz sonucu elde etmeniz mümkün.
Elbette, yalnızca “görsel komutu” kullanmanız gerekmiyor. Google, görsellere ek olarak, eğer elinizde istediğiniz tarzda bir görsel yoksa veya detay eklemek istiyorsanız, metin komutlarını da kullanmanıza olanak tanıyor. Tüm bu süreçlerin ardından, Whisk, sizin belirttiğiniz tarza uygun, referans gösterdiğiniz görsellerin bir karışımını oluşturacak. Kullanıcılar, bu yeni görseller arasından beğendiklerini seçip indirebilecekler. Ayrıca, metin yoluyla oluşturulan görselin üzerinde değişiklikler yapma imkânı da sunuluyor.
Ancak, Whisk’in özellikle fotogerçekçi fotoğraflar için tasarlanmadığını belirtmekte fayda var. Bu model, daha çok farklı tasarım taleplerine cevap vermek için uygun bir seçenek olarak öne çıkıyor. Whisk, şirketin yeni piyasaya sürdüğü görsel oluşturma modeli olan Imagen 3’ten güç alıyor. Şu anda model, herkesin erişimine açık değil, bu nedenle ülkemizden kullanılamıyor. Ancak, bu özellikler ülkemizde kullanıma sunulduğunda sizleri bilgilendireceğiz.
Google’ın Whisk için yayımladığı video