
Uluslararası Matematik Olimpiyatları'nda katılımcılardan cebir, kombinatorik, geometri gibi altı farklı alanda son derece karmaşık problemleri dört buçuk saat içinde çözmeleri isteniyor. Hem OpenAI'ın hem de Google DeepMind'ın yapay zekası bu altı sorudan beşini doğru çözerek 42 üzerinden 35 puan almayı başardı.
Tarihsel olarak baktığımızda, bu yarışmaya katılan genç matematikçiler arasında altın madalya seviyesine ulaşanların oranı yüzde 8'i geçmiyor. Pek az insanın ulaşabildiği bu seviyeye şimdi iki yapay zekanın birden ulaşmış olması, yapay zekaların insan zekasının ötesine geçmeye ne kadar yaklaştığını gözler önüne seriyor.
Google DeepMind, Geçtiğimiz Yıl Gümüş Madalya ile Yetinmişti
Google DeepMind, geçtiğimiz yıl da Gemini'in en gelişmiş versiyonuyla bu yarışmaya katılmış fakat gümüş madalya ile yetinmişti. Gemini'ın bu kez altın madalya seviyesine ulaşması, bu alanda yaşanan ilerlemeyi daha somut bir zemine oturtuyor.
Gemini’nin bu başarısı, klasik tek yönlü muhakeme yerine “paralel düşünme” (parallel thinking) yaklaşımına dayanan yeni bir mimariyle mümkün oldu. Bu yöntemde model, tek bir akıl yürütme zincirini takip etmek yerine, aynı matematiksel problemi çözmek için birden fazla mantıksal yol oluşturarak bu yolları eş zamanlı olarak değerlendiriyor. Her çözüm dalı, kendi içinde bir tür bağımsız hipotez üretiyor ve sistem, bu hipotezleri çapraz kontrol ederek en tutarlı ve sağlam çözüm yolunu seçiyor. Gemini Deep Think adı verilen bu özel sürümde kullanılan tekniklerden biri de “spekülatif akıl yürütme modülleri” (speculative reasoning modules). Bu modüller, çözüm sürecinde belirli adımlarda alternatif kanıt yolları üreterek modelin yalnızca doğru cevabı bulmasına değil, aynı zamanda matematiksel ispat üretmesinde de doğruluğu artırmasına yardımcı oluyor.
Ayrıca model, doğal dil girdilerini doğrudan sembolik mantık yapılarına çevirebilen yeni bir dönüştürücü mekanizma kullanıyor. Bu sayede problem tanımı ile çözüm arasındaki bağ daha şeffaf hâle geliyor. Gemini’nin bu versiyonu, önceki sistemlerdeki gibi soruların programlama dillerine çevrilmesine ihtiyaç duymadan, yalnızca metinsel açıklamayı kullanarak adım adım ispat oluşturabiliyor. DeepMind araştırmacılarına göre bu, modelin tamamen uçtan uca bir şekilde çalıştığını ve sonuçları yorumlamak için dış müdahaleye ihtiyaç duymadığını gösteriyor.
Yarışma jürisi, Gemini'ın çözümlerini değerlendirirken özellikle modelin sunduğu ispatların açıklık, mantıksal bütünlük ve insan matematikçilerin yaklaşımına yakınlığı açısından “dikkat çekici derecede güçlü” olduğunu belirtiyor. Öyle ki bazı çözümler jüri üyeleri tarafından “insan tarafından yazılmış sanılabilecek düzeyde” şeklinde yorumlandı.
OpenAI Bu Yarışmaya Henüz Kamuya Açılmayan Bir Modelle Katıldı

Bu modellerin kısa vadede son kullanıcıya ulaşması beklenmiyor. OpenAI CEO’su Sam Altman, bu seviyedeki muhakeme kabiliyetinin şimdilik sadece araştırma amaçlı kullanılacağını ve GPT serisi modellerin bu yetenek seviyesine bir süre daha ulaşamayacağını belirtiyor.
Yapay zekaların şimdiye kadar zorlandıkları, yaratıcılık gerektiren, açık uçlu ve çok adımlı problemleri artık yüksek başarı oranıyla çözebiliyor olmaları, yeni bir döneme giridiğini gösteriyor. Çünkü yapay zekalar artık salt bilgi işlemin ötesine geçip daha soyut ve yaratıcı muhakemeler yapabilecek seviyeye ulaşmış durumda.
Kaynakça https://venturebeat.com/ai/google-deepmind-makes-ai-history-with-gold-medal-win-at-worlds-toughest-math-competition/ https://www.engadget.com/ai/openais-experimental-model-achieved-gold-at-the-international-math-olympiad-182719801.html Bu haberi ve diğer DH içeriklerini, gelişmiş mobil uygulamamızı kullanarak görüntüleyin:

