Yapay Zeka
0

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Aynı şekilde Gemini, ChatGPT’nin en büyük rakiplerinden biri olarak öne çıkıyor. Bu üç büyük yapay zekâ modeli, görsel işleme konusundaki yetenekleriyle de dikkat çekiyor. Günümüzde görsel verilerin yapay zekâ tarafından işlenmesi, kullanıcı deneyiminin vazgeçilmez bir parçası hâline geldi. ChatGPT, GPT-4V entegrasyonuyla fotoğraflardaki nesneleri tanımlama yeteneğine sahipken, Google Gemini, çoklu modal yaklaşımı sayesinde görsel ve metni birleştirerek adeta “düşünen bir göz” işlevi görüyor. Peki, DeepSeek bu rekabette nerede konumlanıyor? Üç modelin de görsel işleme yeteneklerini tek tek test ettik.

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Gemini, ChatGPT ve DeepSeek için tamamen aynı promptları kullanarak görseller oluşturduk. Bakalım hangi model, görsel işleme konusunda diğerlerinden daha başarılı? Not: DeepSeek, görsel üretiminde Janus Pro-7B modelini kullanmaktadır.

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Test Aşamaları

Test Aşamaları

İlk olarak, gün batımında, sakin bir gölün etrafındaki yeşilliklerle kaplı dağlar, gökyüzünün turuncu ve pembe tonlarda olduğu, suyun üzerinde hafif bir sis bulunduğu ve göl kenarında renkli çiçeklerin yer aldığı, gerçekçi ve huzur dolu bir atmosfer çizmelerini istedik.

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

  • Gemini: [Görsel Yetenekleri]
  • ChatGPT: [Görsel Yetenekleri]
  • DeepSeek: [Görsel Yetenekleri]

İkinci olarak, basit bir köpek çizimi talep ettik. “Güneşli bir parkta oturan dost canlısı ve oyuncu bir Golden Retriever yavrusunun ayrıntılı bir görüntüsünü oluşturun. Köpeğin Güneş ışığında parıldayan yumuşak, meraklı gözleri ve şakacı bir şekilde dışarı çıkmış dili olsun. Yavru köpeğin etrafında yeşil çimenler, rengarenk çiçekler ve top ile frizbi gibi dağınık birkaç oyuncak var. Arka planda uzun ağaçlar ve berrak mavi bir gökyüzü mevcut, bu da neşeli ve canlı bir atmosfer yaratıyor.”

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

  • Gemini: [Görsel Yetenekleri]
  • ChatGPT: [Görsel Yetenekleri]
  • DeepSeek: [Görsel Yetenekleri]

Devamında, ülkemizin güzelliklerinden ilham alarak bir sahne oluşturmalarını istedik. “Türkiye’nin kültürel ve doğal güzelliklerinin bir karışımını sergileyen ikonik manzarasının ayrıntılı bir görüntüsünü oluştur. Eşsiz kaya oluşumlarını ve gün doğumunda Kapadokya üzerinde süzülen sıcak hava balonlarını, sahneyi aydınlatan yumuşak altın ışıkla birlikte ekle. Ön planda karmaşık desenli bir halı ve küçük bir masa üzerinde dumanı tüten bir fincan Türk çayı ile tasvir et. Arka planda ülkenin zengin mirasını ve nefes kesici manzarasını vurgulayan uzak dağlar ve açık bir gökyüzü olsun.”

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

  • Gemini: [Görsel Yetenekleri]
  • ChatGPT: [Görsel Yetenekleri]
  • DeepSeek: [Görsel Yetenekleri]

Son olarak, biraz hayal güçlerini konuşturalım. “Uzak bir gezegendeki uzaylı manzarasının ayrıntılı bir görüntüsünü oluştur. Sahnede mavi ve morun canlı tonlarıyla parlayan, biyolüminesan bitkilerden oluşan başka bir dünyaya ait ormanla çevrelenmiş yüksek kristal yapılar yer alsın. Gökyüzü, ruhani bir ışık saçan iki Güneş ile dolu ve devasa halkalı bir gezegen ufka hâkim. Yarı saydam vücutlara ve yumuşak, ışıltılı parıltılara sahip canlılar havada zarafetle hareket ederek bu gerçeküstü ve dünya dışı ortama bir yaşam ve gizem duygusu katsın.”

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

  • Gemini: [Görsel Yetenekleri]
  • ChatGPT: [Görsel Yetenekleri]
  • DeepSeek: [Görsel Yetenekleri]

Metin odaklı bir çıkış yapan DeepSeek, görünüşe göre görsel işleme konusunda Gemini ve ChatGPT’nin biraz gerisinde kalıyor. Ancak gelecekte geliştirilecek bu modelin, her ikisinin de önüne geçip geçemeyeceğini kestirmek zor. Siz bu üç modelin görsel işleme yeteneğini nasıl buldunuz? Yorumlarınızı bizimle paylaşmayı unutmayın!

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

İlginizi çekebilir:

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Benzer yazılar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Fill out this field
Fill out this field
Lütfen geçerli bir e-posta adresi yazın.

Sponsor
Yazılar