ABD’nin Kaliforniya eyaletinde Mayıs ayının ortasında, kamuoyundan gizli bir matematik zirvesi düzenlendi. Aralarında Avrupalı matematikçilerin de bulunduğu dünyaca ünlü 30 bilim insanı, OpenAI tarafından geliştirilen yeni nesil yapay zeka modeli o4-mini ile karşı karşıya geldi. Zirvenin amacı, insan zekasına meydan okuyacak düzeydeki matematik sorularıyla bu yapay zekanın akıl yürütme kabiliyetlerini test etmekti.
o4-mini: Matematiksel Akıl Yürütmede Sıçrama
Diğer büyük dil modelleri (LLM) genellikle kelime tahmini üzerine kuruluyken, o4-mini farklı bir yaklaşım benimsiyor. Özel veri setleri ve insan destekli geri bildirimle eğitilen bu kompakt yapay zeka, geleneksel modellerin ötesine geçerek mantık zincirleri kurabiliyor, çıkarım yapabiliyor ve adım adım çözüm geliştirebiliyor.
Zirveye liderlik eden Virginia Üniversitesi’nden ünlü matematikçi Ken Ono, bu yeteneği şöyle özetliyor:
“Bazı meslektaşlarım, bu modellerin neredeyse bir matematik dehası seviyesine yaklaştığını söylüyor.”
FrontierMath: Yapay Zeka için Gerçek Zorluk
Toplantı, yapay zekaların sınırlarını test etmek için Epoch AI adlı bağımsız bir kuruluşun yürüttüğü FrontierMath projesi kapsamında gerçekleşti. Projede, daha önce hiçbir yapay zekanın eğitilmediği 300 özel matematik sorusu kullanıldı.
Bu soruların çoğunu geleneksel modeller çözemedi. Ancak o4-mini, özellikle doktora düzeyindeki bazı karmaşık soruları yüksek başarıyla çözerek dikkat çekti. Epoch AI’dan araştırmacı Elliot Glazer, Nisan 2025 itibarıyla modelin bu soruların %20’sini doğru çözdüğünü belirtti.
Zirvede Gerçek Zamanlı Şok: Yapay Zeka Soruları Anında Çözdü
Zirvede yer alan uzmanlar, yapay zekaya kendi hazırladıkları özgün ve ileri düzey soruları yöneltti. Ken Ono, “Alanımdaki uzmanların bile açık soru olarak bildiği bir problemi sordum. o4-mini 10 dakika içinde ekranımda çözümünü yazmaya başladı,” dedi.
Model önce sorunun sadeleştirilmiş bir versiyonunu çözerek ilerledi, ardından da asıl soruyu doğru biçimde sonuçlandırdı. Cevabın sonunda ise şu not dikkat çekti:
“Atıf gerekmez çünkü gizemli sayıyı ben hesapladım!”
Bilim İnsanları Endişeli: Yapay Zeka Çok Hızlı Öğreniyor
Zirve sonunda, yapay zekayı alt etmeyi başaran sadece 10 soru bulundu. Ancak katılımcılar, bir yıl gibi kısa sürede gösterilen ilerleme karşısında hem hayranlık hem de tedirginlik duyduklarını dile getirdi.
o4-mini, bir matematikçinin haftalarca uğraşacağı hesaplamaları dakikalar içinde tamamlayabiliyor. Bu durum, bilim dünyasında yapay zekaya körü körüne güvenme riskini gündeme getirdi.
Beşinci Seviye: Bilinmeyene Doğru Yeni Bir Aşama
Toplantının sonunda gözler, henüz kimsenin cevabını bilmediği “beşinci seviye” sorulara çevrildi. Bu aşama, yapay zekanın sadece çözümleyen değil, bilinmeyeni keşfeden bir araca dönüşmesini test edecek.
Ken Ono, bu dönüşümün üniversitelerdeki bilim insanlarının rolünü kökten değiştirebileceğini belirterek şöyle dedi:
“Artık sadece soru çözen değil, yapay zekayı yönlendiren yaratıcı danışmanlara ihtiyacımız var.”
Yeni Nesil Yapay Zeka: Tehdit mi, Araç mı?
Yapay zekanın bilimsel üretkenliği artırma potansiyeli büyük. Ancak etik, güven ve kontrol mekanizmaları olmadan bu gücün nasıl yönlendirileceği kritik önem taşıyor. Ken Ono’nun ifadesiyle:
“Panik yaratmak istemem ama bu LLM’ler, şimdiden dünyanın en iyi doktora öğrencilerinin çoğunu geride bırakıyor.”