Araştırma yapay zekanın temel zayıflığını ortaya çıkardı: Yüzde 26 doğru okuyabildi

Yapay Zekanın Saat ve Takvimleri Okuma Konusundaki Güçsüzlüğü Araştırma İle Gözler Önüne Serildi

Edinburgh Üniversitesi’nden Rohit Saxena liderliğinde yürütülen bir araştırma, Uluslararası Temsillerin Öğrenimi Konferansı (ICLR) 2025’te sunuldu ve 18 Mart’ta arXiv platformunda yayımlandı. Yapılan araştırma, yapay zekanın analog saatleri ve takvim tarihlerini okuma konusunda ne kadar başarısız olduğunu ortaya koydu. Ancak, bulgular henüz hakem değerlendirmesinden geçmedi.

Saxena, yapılan araştırma ile ilgili olarak “Çoğu insan erken yaşta saat okumayı ve takvim kullanmayı öğrenir. Bu çalışma, yapay zeka sistemlerinin gerçek dünyadaki zamana duyarlı görevlerde ne kadar eksik olduğunu gözler önüne seriyor” dedi.

Araştırma kapsamında Meta’nın Llama 3.2-Vision, Anthropic’in Claude-3.5 Sonnet, Google’ın Gemini 2.0 ve OpenAI’ın GPT-4o modellerine özel hazırlanan saat ve takvim görselleri sunuldu. Ancak yapılan testler sonucunda, modellerin saatleri yalnızca %38,7 oranında, takvim tarihlerini ise sadece %26,3 oranında doğru okuyabildiği ortaya çıktı.

Yapılan değerlendirmelerde, yapay zekanın görsel algılama ve mekânsal düşünme konularında yetersiz kaldığı belirtildi. Saxena, “Analog saat okumak, yalnızca görüntü tanıma değil; açı ölçmek, örtüşen akrep-yelkovanı ayırt etmek ve farklı tasarımlarla başa çıkmak anlamına gelir” açıklamasında bulundu.

Araştırma aynı zamanda takvim hesaplamalarında da benzer zayıf sonuçlar elde edildiğini ortaya koydu. Örneğin, “Yılın 153. günü hangi güne denk gelir?” gibi sorulara yapay zeka sistemlerinin çoğu zaman hatalı yanıt verdiği görüldü. Bu tür sorular, sadece bilgiye değil, tutarlı mantıksal düşünme becerisine dayanmaktadır.

Sonuç olarak, araştırma yapay zeka sistemlerinin hala insan benzeri sezgi, soyutlama ve mantık ile hareket edemediğini ve özellikle zaman algısı gibi temel görevlerde insan varlığına duyulan ihtiyacı açıkça ortaya koyuyor.

Related Posts

Yeni bir kan grubu keşfedildi: Gwada Negatif

Fransa’nın ulusal kan tedarik kurumu EFS, dünyada ilk kez tespit edilen yeni bir kan grubu sistemini kamuoyuna duyurdu.

BBC’den yapay zeka devine sert uyarı: “Dava ederiz”

Dünyanın en büyük haber kuruluşlarından biri olan BBC, Amerika Birleşik Devletleri merkezli yapay zeka firması Perplexity’ye karşı telif hakkı ihlali nedeniyle yasal süreç başlatma tehdidinde bulundu. BBC, şirketin yapay zeka destekli sohbet …

Los Angeles olaylarında yağmalanan telefonlar güvenlik sistemine takıldı

Kaliforniya yönetimi sık sık yaşanan yağma suçlarına karşı cezaları ağırlaştırmak için harekete geçiyor.

Buzulların altından gelen gizemli sinyaller bilim insanlarını şaşırttı

Antarktika’da yapılan bilimsel bir deney sırasında, araştırmacılar buzulların altından gelen gizemli radyo dalgaları tespit etti. Fizik alanında önde gelen dergilerden Physical Review Letters’ta yayımlanan çalışmada, bu şaşırtıcı keşif, Antarktik Ani Geçici Anten (ANITA) adlı deney sayesinde gerçekleşti.

Elon Musk’ın yeni uygulaması XChat nasıl olacak?

Elon Musk’ın hafta sonu duyurduğu XChat, güvenlik vadediyor. Peki nasıl kullanılacak?

Microsoft, 300’den fazla kişiyi işten çıkarttı

Teknoloji devi Microsoft, yeni yapılandırma kararının sonucu olarak yüzlerce çalışanıyla yollarını ayırdı.