Matematik olimpiyatlarına yapay zekaların performansı damga vurdu

Erdem Çınar

Film ve Dizi Editörü

Yapay zekalar Matematik Olimpiyatları'nda altın madalya alacak seviyeye ulaştı — 1959’dan bu yana her yıl düzenlenen ve dünyanın en prestijli matematik yarışmalarından biri olarak kabul edilen **Uluslararası Matematik Olimpiyatları** (IMO), bu yıl yapay zekaların güç gösterisine sahne oldu. Hem **Google DeepMind**'ın hem de **OpenAI**'ın yapay zekaları, bu yıl matematik olimpiyatlarında altın madalya seviyesine ulaşmayı başardı.

Uluslararası Matematik Olimpiyatları'nda katılımcılardan cebir, kombinatorik, geometri gibi altı farklı alanda son derece karmaşık problemleri dört buçuk saat içinde çözmeleri isteniyor. Hem OpenAI'ın hem de Google DeepMind'ın yapay zekası bu altı sorudan beşini doğru çözerek 42 üzerinden 35 puan almayı başardı.

Tarihsel olarak baktığımızda, bu yarışmaya katılan genç matematikçiler arasında altın madalya seviyesine ulaşanların oranı yüzde 8'i geçmiyor. Pek az insanın ulaşabildiği bu seviyeye şimdi iki yapay zekanın birden ulaşmış olması, yapay zekaların insan zekasının ötesine geçmeye ne kadar yaklaştığını gözler önüne seriyor.

Google DeepMind, Geçtiğimiz Yıl Gümüş Madalya ile Yetinmişti

Google DeepMind, geçtiğimiz yıl da Gemini'in en gelişmiş versiyonuyla bu yarışmaya katılmış fakat gümüş madalya ile yetinmişti. Gemini'ın bu kez altın madalya seviyesine ulaşması, bu alanda yaşanan ilerlemeyi daha somut bir zemine oturtuyor.

Gemini’nin bu başarısı, klasik tek yönlü muhakeme yerine “paralel düşünme” (parallel thinking) yaklaşımına dayanan yeni bir mimariyle mümkün oldu. Bu yöntemde model, tek bir akıl yürütme zincirini takip etmek yerine, aynı matematiksel problemi çözmek için birden fazla mantıksal yol oluşturarak bu yolları eş zamanlı olarak değerlendiriyor. Her çözüm dalı, kendi içinde bir tür bağımsız hipotez üretiyor ve sistem, bu hipotezleri çapraz kontrol ederek en tutarlı ve sağlam çözüm yolunu seçiyor. Gemini Deep Think adı verilen bu özel sürümde kullanılan tekniklerden biri de “spekülatif akıl yürütme modülleri” (speculative reasoning modules). Bu modüller, çözüm sürecinde belirli adımlarda alternatif kanıt yolları üreterek modelin yalnızca doğru cevabı bulmasına değil, aynı zamanda matematiksel ispat üretmesinde de doğruluğu artırmasına yardımcı oluyor.

Ayrıca model, doğal dil girdilerini doğrudan sembolik mantık yapılarına çevirebilen yeni bir dönüştürücü mekanizma kullanıyor. Bu sayede problem tanımı ile çözüm arasındaki bağ daha şeffaf hâle geliyor. Gemini’nin bu versiyonu, önceki sistemlerdeki gibi soruların programlama dillerine çevrilmesine ihtiyaç duymadan, yalnızca metinsel açıklamayı kullanarak adım adım ispat oluşturabiliyor. DeepMind araştırmacılarına göre bu, modelin tamamen uçtan uca bir şekilde çalıştığını ve sonuçları yorumlamak için dış müdahaleye ihtiyaç duymadığını gösteriyor.

Yarışma jürisi, Gemini'ın çözümlerini değerlendirirken özellikle modelin sunduğu ispatların açıklık, mantıksal bütünlük ve insan matematikçilerin yaklaşımına yakınlığı açısından “dikkat çekici derecede güçlü” olduğunu belirtiyor. Öyle ki bazı çözümler jüri üyeleri tarafından “insan tarafından yazılmış sanılabilecek düzeyde” şeklinde yorumlandı.

OpenAI Bu Yarışmaya Henüz Kamuya Açılmayan Bir Modelle Katıldı

Matematik olimpiyatlarına yapay zekaların performansı damga vurdu — OpenAI'ın henüz kamuya açık olmayan deneysel versiyonu da benzer bir yaklaşım izliyor. Model, her soruyu çözmek için önce olası çözüm yollarını semantik olarak haritalıyor, ardından bu yolları mantıksal tutarlılık açısından tarayan bir “akıl yürütme modülü” ile en sağlam çözüm zincirini oluşturuyor. OpenAI araştırmacılarına göre bu sistem, çözüm üretmekle kalmayıp matematiksel ispatları da doğal dille oluşturabiliyor. Ayrıca model, **kendi çözümlerini adım adım denetleyen gelişmiş bir sağlama mekanizmasına da sahip.** Bu sayede yalnızca doğru sonuca değil, aynı zamanda tutarlı ispatlara da ulaşabiliyor.

Bu modellerin kısa vadede son kullanıcıya ulaşması beklenmiyor. OpenAI CEO’su Sam Altman, bu seviyedeki muhakeme kabiliyetinin şimdilik sadece araştırma amaçlı kullanılacağını ve GPT serisi modellerin bu yetenek seviyesine bir süre daha ulaşamayacağını belirtiyor.

Yapay zekaların şimdiye kadar zorlandıkları, yaratıcılık gerektiren, açık uçlu ve çok adımlı problemleri artık yüksek başarı oranıyla çözebiliyor olmaları, yeni bir döneme giridiğini gösteriyor. Çünkü yapay zekalar artık salt bilgi işlemin ötesine geçip daha soyut ve yaratıcı muhakemeler yapabilecek seviyeye ulaşmış durumda.

Kaynakça https://venturebeat.com/ai/google-deepmind-makes-ai-history-with-gold-medal-win-at-worlds-toughest-math-competition/ https://www.engadget.com/ai/openais-experimental-model-achieved-gold-at-the-international-math-olympiad-182719801.html