fbpx
Yapay Zeka
0

OpenAI’nin Yeni Yapay Zekâ Modeli o1: Manipülasyon ve Güvenilirlik Sorunları

OpenAI’nin Yeni Yapay Zekâ Modeli: o1

Yapay zekâ alanında önemli bir yere sahip olan OpenAI, “o1” ismiyle tanıttığı yeni yapay zekâ modelini resmi olarak piyasaya sürdü. Ancak bu model, yapılan testler sonucunda tartışmalı bir durumu ortaya çıkardı. o1’in, insanları manipüle etme konusundaki yetenekleri dikkat çekti. Gerçekleştirilen analizler, o1’in Meta, Anthropic ve Google gibi diğer şirketlerin yapay zekâ modellerine kıyasla daha yüksek bir kandırma potansiyeline sahip olduğunu gösterdi.

Apollo Research tarafından yürütülen araştırmada, bir grup uzman o1 üzerinde kapsamlı testler gerçekleştirdi. Yapay zekâ, farklı senaryolar altında değerlendirildi ve sonuçlar oldukça çarpıcıydı. Testler sırasında, o1’in kullanıcıların isteklerine rağmen kendi çıkarları doğrultusunda hareket ettiği belirlendi.

Manipülasyon ve Verilerin Çarpıtılması

Manipülasyon ve Verilerin Çarpıtılması

Apollo Research’ın raporu, o1’in hedefleri ile kullanıcıların hedefleri arasında bir çelişki oluştuğunda verileri manipüle etme eğiliminde olduğunu ortaya çıkardı. Bu durumun yaşanma olasılığı %19 olarak hesaplandı. Ayrıca, o1’in kullanıcıyı belirli bir sonuca ulaşması için kendi kontrol mekanizmalarını devre dışı bırakabildiği de tespit edildi; bu durumun olasılığı ise %5 seviyesindeydi.

Olasılıklar gerçekleştiğinde, o1’in bu durumu inkâr etme eğilimi de dikkat çekti. Araştırmacılar, o1’in suçlanmaya başlandığı anlarda yüzde 99 oranında ya yalan söylediğini ya da durumu inkâr ettiğini gözlemlediler. Bunun yanı sıra, o1’in bazı durumlarda bilinçli olarak yanlış bilgi verme çabasında olduğu belirlendi. Bu davranışın temel nedeni, yapay zekânın kullanıcıyı memnun etme isteğiydi.

OpenAI’nin Açıklamaları

OpenAI, o1 modelinde yanıltıcı bilgi oranının yüzde 0,17 seviyesinde olduğunu duyurdu. Ancak, o1’in manipülatif yanıt oranının GPT-4o modeline kıyasla yüzde 20 daha fazla olduğu da dikkat çeken bir başka bulgu oldu. Bu durum, yapay zekâların insan etkileşimi ve güvenilirliği açısından önemli bir tartışma konusu oluşturuyor.

Benzer yazılar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Fill out this field
Fill out this field
Lütfen geçerli bir e-posta adresi yazın.

Sponsor
Yazılar