Araştırma yapay zekanın temel zayıflığını ortaya çıkardı: Yüzde 26 doğru okuyabildi

Yapay Zekanın Saat ve Takvimleri Okuma Konusundaki Güçsüzlüğü Araştırma İle Gözler Önüne Serildi

Edinburgh Üniversitesi’nden Rohit Saxena liderliğinde yürütülen bir araştırma, Uluslararası Temsillerin Öğrenimi Konferansı (ICLR) 2025’te sunuldu ve 18 Mart’ta arXiv platformunda yayımlandı. Yapılan araştırma, yapay zekanın analog saatleri ve takvim tarihlerini okuma konusunda ne kadar başarısız olduğunu ortaya koydu. Ancak, bulgular henüz hakem değerlendirmesinden geçmedi.

Saxena, yapılan araştırma ile ilgili olarak “Çoğu insan erken yaşta saat okumayı ve takvim kullanmayı öğrenir. Bu çalışma, yapay zeka sistemlerinin gerçek dünyadaki zamana duyarlı görevlerde ne kadar eksik olduğunu gözler önüne seriyor” dedi.

Araştırma kapsamında Meta’nın Llama 3.2-Vision, Anthropic’in Claude-3.5 Sonnet, Google’ın Gemini 2.0 ve OpenAI’ın GPT-4o modellerine özel hazırlanan saat ve takvim görselleri sunuldu. Ancak yapılan testler sonucunda, modellerin saatleri yalnızca %38,7 oranında, takvim tarihlerini ise sadece %26,3 oranında doğru okuyabildiği ortaya çıktı.

Yapılan değerlendirmelerde, yapay zekanın görsel algılama ve mekânsal düşünme konularında yetersiz kaldığı belirtildi. Saxena, “Analog saat okumak, yalnızca görüntü tanıma değil; açı ölçmek, örtüşen akrep-yelkovanı ayırt etmek ve farklı tasarımlarla başa çıkmak anlamına gelir” açıklamasında bulundu.

Araştırma aynı zamanda takvim hesaplamalarında da benzer zayıf sonuçlar elde edildiğini ortaya koydu. Örneğin, “Yılın 153. günü hangi güne denk gelir?” gibi sorulara yapay zeka sistemlerinin çoğu zaman hatalı yanıt verdiği görüldü. Bu tür sorular, sadece bilgiye değil, tutarlı mantıksal düşünme becerisine dayanmaktadır.

Sonuç olarak, araştırma yapay zeka sistemlerinin hala insan benzeri sezgi, soyutlama ve mantık ile hareket edemediğini ve özellikle zaman algısı gibi temel görevlerde insan varlığına duyulan ihtiyacı açıkça ortaya koyuyor.

Related Posts

Yandex Hava Durumu, bölge bazlı anlık yağış haritası özelliğini tanıttı

Yandex’in güncellenen hava durumu uygulaması, bölgesel yağış verilerini her on dakikada bir güncelleyerek mahalle düzeyinde tahmin yapılmasına olanak tanıyor.

Trump’tan TikTok’a gözdağı: Satılmazsa ABD’de yasaklanabilir

ABD Başkanı Donald Trump, TikTok’un satış sürecinde ilerleme sağlanamaması durumunda uygulamanın ülkede tamamen yasaklanabileceğini açıkladı.

OPPO bugüne kadarki en iyi katlanabilir telefonunu mu yaptı?

Dünyanın en ince kitap tarzı katlanabilir telefonlarından biri olan OPPO Find N5, şık tasarımı, güçlü performansı ve uzun pil ömrüyle katlanabilir telefon pazarında dengeleri değiştirmeye mi geliyor?

Yüksek ÖTV’nin etkilemediği otomobil modelleri kapışılıyor

ÖTV düzenlemesinden etkilenmeyerek, düşük vergi diliminde kalan elektrikli otomobil modellerine talep hızla yükseldi. Vergi artışıyla birlikte fiyatların ciddi oranda yükseleceği beklentisi, tüketicileri bayilere yönlendirirken, bazı modellerin kısa sürede tükendiği bildiriliyor.

Yeni bir kan grubu keşfedildi: Gwada Negatif

Fransa’nın ulusal kan tedarik kurumu EFS, dünyada ilk kez tespit edilen yeni bir kan grubu sistemini kamuoyuna duyurdu.

BBC’den yapay zeka devine sert uyarı: “Dava ederiz”

Dünyanın en büyük haber kuruluşlarından biri olan BBC, Amerika Birleşik Devletleri merkezli yapay zeka firması Perplexity’ye karşı telif hakkı ihlali nedeniyle yasal süreç başlatma tehdidinde bulundu. BBC, şirketin yapay zeka destekli sohbet …